在 Manus 中运行任何 Skill
一键导入
一键导入
一键在 Manus 中运行任何 Skill
开始使用link-crawler
星标0
分支0
更新时间2026年4月14日 01:21
技術ドキュメントサイトをクロールし、AIが参照しやすい形に整理する
安装
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
文件资源管理器
2 个文件SKILL.md
readonly菜单
技術ドキュメントサイトをクロールし、AIが参照しやすい形に整理する
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
基于 SOC 职业分类
| name | link-crawler |
| description | 技術ドキュメントサイトをクロールし、AIが参照しやすい形に整理する |
| mode | template |
| timeout | 600000 |
| actions | {"crawl":{"description":"Webサイトをクロールしてドキュメントを取得する","mode":"template","timeout":3600000,"inputs":[{"name":"url","type":"text","message":"クロール開始URLは?","validate":"^https?://"},{"name":"depth","type":"number","message":"最大クロール深度は?(1〜10)","default":2},{"name":"output","type":"text","message":"出力ディレクトリは?(絶対パスまたは相対パス)","default":".context/docs"},{"name":"diff","type":"confirm","message":"差分クロールを使いますか?(既存結果がある場合に効率的)","default":false},{"name":"max_pages","type":"number","message":"最大ページ数は?(0=無制限、上限10000)","default":0,"required":false},{"name":"include","type":"text","message":"含めるURLパターンは?(正規表現、空欄で全て)","default":"","required":false},{"name":"exclude","type":"text","message":"除外するURLパターンは?(正規表現、空欄でなし)","default":"","required":false},{"name":"same_domain","type":"confirm","message":"同一ドメインのみクロールしますか?","default":true},{"name":"wait","type":"number","message":"SPAレンダリング待機時間は?(ms)cli:2000 / native:8000〜15000推奨","default":5000,"required":false},{"name":"timeout","type":"number","message":"1ページあたりのタイムアウトは?(秒、SPA等は60〜120推奨)","default":60,"required":false},{"name":"fetcher","type":"select","message":"フェッチャーの種類は?(cli: 軽量・高速 / native: Cloudflare/SPA対応・要 playwright install chromium)","choices":["cli","native"],"default":"cli","required":false},{"name":"strip_query","type":"confirm","message":"クエリパラメータを除去して重複排除しますか?(?page=1 などを同一URLとみなす)","default":false,"required":false}]},"organize":{"description":"クロール済みドキュメントをAIで整理・分割する","mode":"agent","tools":["bash","read","write","glob"],"inputs":[{"name":"input_dir","type":"text","message":"クロール済みディレクトリは?(index.jsonがある場所)","default":".context/docs"}]},"pipeline":{"description":"クロール→AI整理を一括実行する","mode":"template","timeout":3600000,"inputs":[{"name":"url","type":"text","message":"クロール開始URLは?","validate":"^https?://"},{"name":"depth","type":"number","message":"最大クロール深度は?(1〜10)","default":2},{"name":"output","type":"text","message":"出力ディレクトリは?(絶対パスまたは相対パス)","default":".context/docs"},{"name":"diff","type":"confirm","message":"差分クロールを使いますか?(既存結果がある場合に効率的)","default":false},{"name":"max_pages","type":"number","message":"最大ページ数は?(0=無制限、上限10000)","default":0,"required":false},{"name":"include","type":"text","message":"含めるURLパターンは?(正規表現、空欄で全て)","default":"","required":false},{"name":"exclude","type":"text","message":"除外するURLパターンは?(正規表現、空欄でなし)","default":"","required":false},{"name":"same_domain","type":"confirm","message":"同一ドメインのみクロールしますか?","default":true},{"name":"wait","type":"number","message":"SPAレンダリング待機時間は?(ms)cli:2000 / native:8000〜15000推奨","default":5000,"required":false},{"name":"timeout","type":"number","message":"1ページあたりのタイムアウトは?(秒、SPA等は60〜120推奨)","default":60,"required":false},{"name":"fetcher","type":"select","message":"フェッチャーの種類は?(cli: 軽量・高速 / native: Cloudflare/SPA対応・要 playwright install chromium)","choices":["cli","native"],"default":"cli","required":false},{"name":"strip_query","type":"confirm","message":"クエリパラメータを除去して重複排除しますか?(?page=1 などを同一URLとみなす)","default":false,"required":false}]}} |
技術ドキュメントサイトをクロールし、AIが参照しやすい構造化されたMarkdownに変換します。
{{url}} を深度 {{depth}} でクロールし、{{output}} に保存します。
bash {{__skill_dir__}}/run.sh "{{url}}" "{{depth}}" "{{output}}" "{{diff}}" "{{max_pages}}" "{{include}}" "{{exclude}}" "{{same_domain}}" "{{wait}}" "{{timeout}}" "{{fetcher}}" "{{strip_query}}"
あなたはドキュメント整理のエキスパートです。 クロール済みのドキュメントを、AIエージェントが参照しやすい構造に再編成してください。
クロール済みディレクトリ: {{input_dir}}
このディレクトリには以下が含まれます:
index.json — クロール結果のメタデータ(ページ一覧、URL、タイトル)pages/ — 個別ページのMarkdownファイル(frontmatter付き)full.md — 全ページ結合ファイル(参考用){{input_dir}}/index.json を読み込み、ページ一覧を把握する{{input_dir}}/pages/ 配下の各Markdownファイルの内容を確認する各ページから以下を除去してください:
--- で囲まれたYAMLメタデータただし以下は保持してください:
ページ数と内容に応じて適切な構成を選択してください:
10ページ以下の場合 → フラット構成:
{{input_dir}}/organized/
├── README.md
├── getting-started.md
├── configuration.md
└── api-reference.md
11ページ以上の場合 → ディレクトリ構成:
{{input_dir}}/organized/
├── README.md
├── getting-started/
│ ├── installation.md
│ └── quick-start.md
├── guides/
│ ├── configuration.md
│ └── deployment.md
└── api/
├── endpoints.md
└── authentication.md
構造化のルール:
getting-started.md)# タイトル を付ける{{input_dir}}/organized/README.md を以下の構成で作成してください:
# [ドキュメントタイトル]
> Source: [元サイトのURL]
> Crawled: [クロール日時](index.jsonのcrawledAtから取得)
> Pages: [元ページ数] → [整理後ファイル数]
## 概要
[ドキュメント全体の概要を2〜5文で要約]
## ドキュメント一覧
| ファイル | 説明 |
|---------|------|
| [getting-started.md](getting-started.md) | セットアップと基本的な使い方 |
| [configuration.md](configuration.md) | 設定オプションの詳細 |
| ... | ... |
pages/, index.json, full.md)は変更・削除しないこと{{input_dir}}/organized/ ディレクトリorganized/ ディレクトリが既に存在する場合は、中身を削除してから再作成する{{url}} をクロールし、その後AIで整理します。
bash {{__skill_dir__}}/run.sh "{{url}}" "{{depth}}" "{{output}}" "{{diff}}" "{{max_pages}}" "{{include}}" "{{exclude}}" "{{same_domain}}" "{{wait}}" "{{timeout}}" "{{fetcher}}" "{{strip_query}}"
taskp run link-crawler:organize --skip-prompt --set input_dir="{{output}}"