تشغيل أي مهارة في Manus بنقرة واحدة

firecrawl-scrape-cn

النجوم٠

التفرعات٠

آخر تحديث٢٤ مايو ٢٠٢٦ في ٠١:٥٦

"从任意 URL 提取干净的 Markdown，支持 JS 渲染的 SPA 页面，针对中文网站优化。触发：抓取、抓网页、获取页面、从 URL 提取、读取网页（需提供 URL）。需要 Firecrawl API key。不适用于：本地文件操作、git 命令、代码编辑；简单无 JS 渲染的页面可用 web_fetch。"

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

تشغيل في Manus

المصدر

zxc1213

zxc1213/openclaw-ai-workspace

فتح مستودع GitHub عرض مستودعات المنشئ

تنزيل

تشغيل في Manus

المهن ذات الصلةSOC

استنادا إلى تصنيف SOC المهني

مطوّرو البرمجياتمهن الحاسوب والرياضيات·SOC 15-1252

مستكشف الملفات

2 ملفات

SKILL.md

readonly

name: firecrawl-scrape-cn description: "从任意 URL 提取干净的 Markdown，支持 JS 渲染的 SPA 页面，针对中文网站优化。触发：抓取、抓网页、获取页面、从 URL 提取、读取网页（需提供 URL）。需要 Firecrawl API key。不适用于：本地文件操作、git 命令、代码编辑；简单无 JS 渲染的页面可用 web_fetch。" 从任意 URL 提取干净的 Markdown 内容，包括 JS 渲染的 SPA。当用户提供 URL 并想要其内容、说"抓取"、"抓网页"、"获取页面"、"从 URL 提取"或"读取网页"时使用此 Skill。支持 JS 渲染页面、多个并发 URL，返回 LLM 优化的 Markdown。 allowed-tools:

Bash(firecrawl *)
Bash(npx firecrawl *)

Firecrawl 网页抓取

抓取一个或多个 URL，返回干净的、LLM 优化的 Markdown。多个 URL 并发抓取。

使用场景

你有特定的 URL 并想要其内容
页面是静态或 JS 渲染的（SPA）
工作流升级模式的第 2 步：搜索 → 抓取 → 映射 → 爬取 → 交互

快速开始

# 基础 Markdown 提取
firecrawl scrape "<url>" -o .firecrawl/page.md

# 仅主内容，无导航/页脚
firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

# 等待 JS 渲染后抓取
firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

# 多个 URL（每个保存到 .firecrawl/）
firecrawl scrape https://example.com https://example.com/blog https://example.com/docs

# 获取 Markdown 和链接
firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

# 询问页面内容的问题
firecrawl scrape "https://example.com/pricing" --query "企业版价格是多少？"

选项

选项	描述
`-f, --format <formats>`	输出格式：markdown, html, rawHtml, links, screenshot, json
`-Q, --query <prompt>`	询问页面内容的问题（5 积分）
`-H`	在输出中包含 HTTP 头
`--only-main-content`	去除导航、页脚、侧边栏 — 仅主内容
`--wait-for <ms>`	抓取前等待 JS 渲染
`--include-tags <tags>`	仅包含这些 HTML 标签
`--exclude-tags <tags>`	排除这些 HTML 标签
`-o, --output <path>`	输出文件路径

提示

优先使用普通抓取而非 --query。 抓取到文件，然后用 grep、head 或直接读取 Markdown — 你可以自己搜索和推理完整内容。仅当你想要单个目标答案而不保存页面时使用 --query（额外消耗 5 积分）。
先尝试抓取再交互。 抓取可以处理静态页面和 JS 渲染的 SPA。仅在需要交互（点击、表单填充、分页）时升级到 interact。
多个 URL 并发抓取 — 用 firecrawl --status 查看你的并发限制。
单格式输出原始内容。多格式（如 --format markdown,links）输出 JSON。
始终引用 URL — shell 会将 ? 和 & 解释为特殊字符。
命名约定：.firecrawl/{site}-{path}.md

另见

firecrawl-search — 当你没有 URL 时查找页面
firecrawl-browser — 当抓取无法获取内容时，用 interact 点击、填充表单等
firecrawl-download — 批量下载整个站点到本地文件

中文翻译版 | 原版：firecrawl-scrape version: "1.0.0"

المزيد من هذا المستودع

نفس المستودع

agent-browser

zxc1213/openclaw-ai-workspace

Fast headless browser automation for AI agents (Rust-based with Node.js fallback). Navigate, click, type, and snapshot pages via structured commands. Triggers on browser automation, headless browsing, page snapshot. NOT for: websites needing login/cookies (use bb-browser or browser profile), or simple URL content extraction (use web_fetch/firecrawl).

2026-05-240

arxiv

zxc1213/openclaw-ai-workspace

Search, download, and summarize academic papers from arXiv. Built for AI/ML researchers.

2026-05-240

bb-browser-sites

zxc1213/openclaw-ai-workspace

将网站操作封装为 CLI 命令，覆盖 Twitter、Reddit、GitHub、知乎、B站、微博等 36 个平台 103 条命令。直接使用 OpenClaw 浏览器，无需额外扩展。触发：需要程序化操作特定平台。适用于需要与特定平台交互的场景。不适用于通用网页抓取（用 firecrawl）、无平台上下文的浏览器自动化、本地文件操作。

2026-05-240

browser-use

zxc1213/openclaw-ai-workspace

自动化浏览器交互：网页测试、表单填写、截图、数据提取。触发：需要导航网站、与网页交互、填写表单、截图、提取信息。需要浏览器工具可用。不适用于简单 URL 抓取（用 web_fetch）、需要完整渲染的 JS 重度站点（用 firecrawl）、批量无头自动化（用 agent-browser）。

2026-05-240

browserwing

zxc1213/openclaw-ai-workspace

"通过 HTTP API 控制浏览器自动化：页面导航、元素交互（点击/输入/选择）、数据提取、无障碍快照、截图、JS 执行、批量操作。触发：需要通过 API 程序化控制浏览器。不适用于：一次性简单浏览器任务（用 agent-browser）、平台特定交互（用 bb-browser）。"

2026-05-240

chinese-git-workflow

zxc1213/openclaw-ai-workspace

适配国内 Git 平台和团队习惯的工作流规范——Gitee、Coding、极狐 GitLab、CNB 全覆盖

2026-05-240

Bash(firecrawl *)
Bash(npx firecrawl *)

Firecrawl 网页抓取

抓取一个或多个 URL，返回干净的、LLM 优化的 Markdown。多个 URL 并发抓取。

使用场景

你有特定的 URL 并想要其内容
页面是静态或 JS 渲染的（SPA）
工作流升级模式的第 2 步：搜索 → 抓取 → 映射 → 爬取 → 交互

快速开始

# 基础 Markdown 提取
firecrawl scrape "<url>" -o .firecrawl/page.md

# 仅主内容，无导航/页脚
firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

# 等待 JS 渲染后抓取
firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

# 多个 URL（每个保存到 .firecrawl/）
firecrawl scrape https://example.com https://example.com/blog https://example.com/docs

# 获取 Markdown 和链接
firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

# 询问页面内容的问题
firecrawl scrape "https://example.com/pricing" --query "企业版价格是多少？"

选项

选项	描述
`-f, --format <formats>`	输出格式：markdown, html, rawHtml, links, screenshot, json
`-Q, --query <prompt>`	询问页面内容的问题（5 积分）
`-H`	在输出中包含 HTTP 头
`--only-main-content`	去除导航、页脚、侧边栏 — 仅主内容
`--wait-for <ms>`	抓取前等待 JS 渲染
`--include-tags <tags>`	仅包含这些 HTML 标签
`--exclude-tags <tags>`	排除这些 HTML 标签
`-o, --output <path>`	输出文件路径

提示

优先使用普通抓取而非 --query。 抓取到文件，然后用 grep、head 或直接读取 Markdown — 你可以自己搜索和推理完整内容。仅当你想要单个目标答案而不保存页面时使用 --query（额外消耗 5 积分）。
先尝试抓取再交互。 抓取可以处理静态页面和 JS 渲染的 SPA。仅在需要交互（点击、表单填充、分页）时升级到 interact。
多个 URL 并发抓取 — 用 firecrawl --status 查看你的并发限制。
单格式输出原始内容。多格式（如 --format markdown,links）输出 JSON。
始终引用 URL — shell 会将 ? 和 & 解释为特殊字符。
命名约定：.firecrawl/{site}-{path}.md

另见

firecrawl-search — 当你没有 URL 时查找页面
firecrawl-browser — 当抓取无法获取内容时，用 interact 点击、填充表单等
firecrawl-download — 批量下载整个站点到本地文件

中文翻译版 | 原版：firecrawl-scrape version: "1.0.0"