| name | web-content-fetcher |
| description | 网页内容获取工具 | 当常规爬虫被过滤时,使用替代服务获取网页内容。支持:1) r.jina.ai - 最稳定 2) markdown.new - Cloudflare 专用 3) defuddle.md - 备用方案。触发词:获取网页内容、网页转markdown、内容抓取、fetch webpage、bypass cloudflare |
| version | 1.0.0 |
| triggers | ["抓取网页内容","获取网页","fetch"] |
| author | Boss |
网页内容获取工具
当常规 web_fetch/web_search 无法获取内容时,使用替代服务获取网页 Markdown 格式内容。
支持的服务
| 优先级 | 服务 | 用法 | 适用场景 |
|---|
| 1 | r.jina.ai | https://r.jina.ai/{url} | 最稳定,通用性强 |
| 2 | markdown.new | https://markdown.new/{url} | Cloudflare 保护网站 |
| 3 | defuddle.md | https://defuddle.md/{url} | 备用方案 |
使用方法
直接调用
当需要获取网页内容时,按顺序尝试:
- 首先用
web_fetch 尝试获取
- 如果失败或被过滤,调用本工具
curl -s "https://r.jina.ai/https://example.com"
curl -s "https://markdown.new/https://example.com"
curl -s "https://defuddle.md/https://example.com"
API 格式
fetch_webpage <url>
fetch_webpage <url> --method jina|markdown|defuddle
示例
用户: 帮我获取 https://news.example.com/article/123 的内容
助手: (使用 r.jina.ai 获取)
工具脚本
本目录包含 fetch.sh 脚本,可直接调用:
./fetch.sh https://example.com
./fetch.sh https://example.com jina
让网页内容获取不再受限 🌐