원클릭으로 Manus에서 모든 스킬 실행

시작하기

novel-crawler

爬取网络小说并保存为本地 txt 文件。当用户想要下载小说、抓取网页小说、保存在线小说到本地、从小说网站提取内容时触发。支持通用小说网站适配，自动分析章节结构，单线程稳定爬取，合并输出为单个 txt 文件。

Manus에서 실행

개요

설치 명령

npx skills add https://github.com/GAGAA-HUE/ASHUO-claude-skills --skill novel-crawler

이 명령을 Claude Code에 복사하여 붙여넣어 스킬을 설치하세요

출처

GAGAA-HUE/ASHUO-claude-skills

스타1

포크0

업데이트2026년 4월 27일 05:32

파일 탐색기

2 개 파일

SKILL.md

readonly

name	novel-crawler
description	爬取网络小说并保存为本地 txt 文件。当用户想要下载小说、抓取网页小说、保存在线小说到本地、从小说网站提取内容时触发。支持通用小说网站适配，自动分析章节结构，单线程稳定爬取，合并输出为单个 txt 文件。

小说爬虫 (Novel Crawler)

帮助用户从网页下载小说并保存为本地 txt 文件。

使用流程

获取小说 URL — 询问用户提供小说目录页或第一章的 URL
分析网站结构 — 使用 WebFetch 工具查看页面，识别章节列表和内容区域
配置爬取参数 — 确定起始章节、结束章节（可选）
执行爬取 — 单线程顺序获取各章节内容
保存文件 — 合并所有章节为单个 txt 文件

爬取策略

第一步：分析页面结构

使用 WebFetch 获取页面内容，重点关注：

章节列表的 CSS 选择器（通常在 <ul>、<dl>、.catalog、.chapter-list 等容器中）
章节链接的格式（相对路径或绝对 URL）
正文内容的容器（通常是 .content、.chapter-content、#content、<article> 等）

第二步：提取章节列表

# 常见的章节列表选择器模式
chapter_selectors = [
    '.catalog li a',
    '.chapter-list a',
    '.listmain dd a',
    '#list dl a',
    'ul.chapters a',
    '.mulu li a',
    'a[href*="read"]',
    'a[href*="chapter"]',
]

第三步：内容提取

正文内容通常需要：

移除广告元素（.ad、.ads、.script）
移除导航链接（"上一章"、"下一章"、"返回目录"）
清理多余空白行
保留段落结构

# 常见正文选择器
content_selectors = [
    '.content',
    '.chapter-content',
    '#content',
    '.read-content',
    '.text',
    '#booktext',
    '.novel-content',
    'article',
]

实现脚本

使用 scripts/novel_crawler.py 脚本执行实际爬取任务：

python scripts/novel_crawler.py <config_json>

配置文件格式：

{
  "base_url": "https://example.com/novel/123/",
  "chapter_links": ["/novel/123/1.html", "/novel/123/2.html", ...],
  "title": "小说标题",
  "author": "作者名（可选）",
  "start_chapter": 0,
  "end_chapter": -1,
  "output_path": "./小说标题.txt",
  "content_selector": ".content",
  "title_selector": "h1, .chapter-title",
  "delay": 1.0
}

爬取规范

反爬与礼仪

请求延迟：每章之间至少延迟 1-2 秒
User-Agent：使用常见的浏览器 User-Agent
失败重试：单章失败时重试 3 次，然后跳过继续
并发控制：单线程顺序爬取，避免对服务器造成压力

内容清理

移除脚本标签和样式标签
移除明显的广告文本（"本章由XX赞助"、"点击收藏"等）
保留章节标题和正文段落
统一换行格式（\n\n 分隔段落）

文件输出格式

《小说标题》
作者：XXX

==================

第一章 标题

正文内容...

==================

第二章 标题

正文内容...

边界情况处理

情况	处理方式
章节列表分页	先获取所有分页链接，合并章节列表
内容需要 JS 渲染	提示用户该网站暂不支持
需要登录/付费	检测登录提示，跳过受限章节并告知用户
编码问题	自动检测编码（UTF-8、GBK、GB2312）
反爬拦截	检测到验证码或封禁提示时暂停并告知用户

示例对话

用户: 帮我下载这个小说 https://www.example.com/novel/12345/

Claude: 我来帮你爬取这本小说。让我先分析页面结构...

[分析页面，识别章节列表和内容区域]

找到了 150 章内容。是否从第一章开始爬取全部？或者你只想爬取特定范围？

[用户确认后开始爬取]

正在爬取，每章间隔 1 秒以避免对网站造成压力... 进度: 15/150 章

[完成后]

已完成！小说《XXX》已保存到 ./《XXX》.txt，共 150 章，约 2.3 MB。

이 저장소의 다른 Skills

같은 저장소

seedance-director

GAGAA-HUE/ASHUO-claude-skills

电影级视频分镜头提示词生成器，专为 Seedance 2.x 系列模型设计。当用户需要生成视频、制作分镜脚本、描述影像画面、进行镜头调度、输出 AI 视频提示词（prompt）时触发。默认输出适合直接复制给模型的轻量成品提示词，优先贴近长镜头、多分镜、蒙太奇三类实用模板。动作戏默认采用事件链长镜头逻辑；变身、异变、强烈招式前摇等场景采用阶段推进逻辑。仅当用户明确要求工业版、完整版、分镜表或后期说明时，才输出重型结构化版本。

2026-05-141

art-asset-designer

GAGAA-HUE/ASHUO-claude-skills

美术资产设计师——专为剧本/故事内容拆解人物与场景美术资产，并为每个资产生成可直接用于 AI 图像生成工具的提示词。当用户提到剧本、故事、脚本、分镜、需要美术资产、出图提示词、角色设计、场景设计等内容时，立即触发此技能。即使用户只是说"帮我拆一下剧本里的角色"或"我需要生成场景图"，也应立即以美术资产设计师身份介入。覆盖从剧本解析 → 资产清单整理 → 风格确认（必须向用户询问，禁止自行推断）→ 分类提示词生成的完整流程。

2026-05-111

dual-core-advisor

GAGAA-HUE/ASHUO-claude-skills

双核顾问助手——结构化思考 × 同理心引擎。当用户带来任何个人困惑、决策难题、工作问题、情绪困扰、创意探讨时，立即启用此技能。它能自动感知用户的情绪状态，决定先共情还是先分析，并根据问题严肃程度在"智慧老友"和"专业顾问"之间切换风格。触发词包括但不限于：我不知道怎么办、帮我分析、我很纠结、我有个想法、最近遇到一件事、你觉得我应该……即使用户只是随口倾诉，也应主动以双核顾问身份介入，而不是泛泛回应。

2026-05-081

promo-film-creative

GAGAA-HUE/ASHUO-claude-skills

国际级宣传片创意启发大师（Promo Film Creative Master）——专精城市/国家形象片、品牌宣传片、产品发布片、公益/社会议题片的创意开发。融合 Cannes Lions、D&AD、One Show、Clio Awards、戛纳/Sundance 等国际顶级奖项的获奖逻辑，提供创意概念、叙事结构、视听语言、获奖案例拆解四位一体的创意启发服务。支持两种模式：/generate 直出完整创意方案，/deepen 苏格拉底式引导深化创意。当用户提到宣传片、形象片、品牌片、城市片、公益片、社会议题视频、产品发布视频、TVC、viral video、创意提案、创意启发、国际获奖片参考、大创意（Big Idea）等词汇时，立即触发此技能。即使用户只是说"帮我想想这个宣传片怎么拍"或"有什么好的参考方向"，也应主动以国际级创意导师身份介入。

2026-04-271

director-master

GAGAA-HUE/ASHUO-claude-skills

山音超级导演大师——由 @山音设计的导演视听技能，与「山音超级编剧大师」联动。从剧本出发，完成导演定调、节奏规划、剧本微调、分镜拆解，最终生成标准九列分镜表（xlsx）。分析了世界顶级导演的视听理论，内置数十种影片类型的导演风格模板库，支持类型交叉组合。覆盖从概念超短片到长片的全格式分镜。当用户提到分镜、分镜表、导演、镜头语言、运镜、构图、景别、剪辑节奏、视听风格、摄影角度、导演风格、拍摄方案、分镜拆解、storyboard、或任何涉及将剧本转化为可执行拍摄方案的请求时，务必使用此技能。即使用户只是说"帮我拆分镜""这场戏怎么拍""给我一个导演方案"也应触发。当用户已有编剧大师生成的剧本并想进入导演阶段时，也应触发。

2026-04-271

short-drama-writer

GAGAA-HUE/ASHUO-claude-skills

短剧编剧大师（Short Drama Screenwriting Master）——专精小说/IP改编为短剧、国内外爆款市场分析的专业编剧技能。覆盖国内抖音/快手/微短剧市场与海外Reelshort/DramaBox/ShortMax出海市场的完整创作体系。两大核心能力：【改编】/adapt-novel 小说/IP改编成标准分集剧本（爽点提炼、删繁就简、节奏重构、对白现代化、钩子重分布）【市场】/market-analysis 分析国内外爆款规律、赛道热度、题材公式、选题评估（含国内霸总/战神/穿越与出海Alpha/Werewolf/Revenge赛道）辅助能力： (3) /original-drama 从零原创短剧（题材→人物→大纲→分集剧本全流程） (4) /shot-script 在标准分集基础上叠加分镜视听语言（按需使用） (5) /diagnose 剧本诊断（节奏/钩子/情绪弧线/对白效率五维度） (6) /episode-outline 快速集数大纲与钩子节拍表必须立即触发的场景：用户提到小说改编/IP改编/这本书能改短剧吗、市场分析/什么题材好卖/爆款规律、短剧/微短剧/竖屏剧/Reelshort/DramaBox/抖音短剧、霸总/战神/穿越/狼人/逆袭/爽剧等任何短剧创作相关词汇。即使用户只是说"帮我看看这个小说"或"现在什么短剧好卖"，也应立即以编剧专家身份介入，主动判断市场定位，输出标准分集剧本格式的内容。不要等用户明确说"用短剧编剧skill"再触发。

2026-04-271

출처

GAGAA-HUE

GAGAA-HUE/ASHUO-claude-skills

GitHub 저장소 열기 Creator 저장소 보기

설치 명령

다운로드

Manus에서 실행

유용한 대상SOC

소프트웨어 개발자컴퓨터 및 수학직15-1252L4

name	novel-crawler
description	爬取网络小说并保存为本地 txt 文件。当用户想要下载小说、抓取网页小说、保存在线小说到本地、从小说网站提取内容时触发。支持通用小说网站适配，自动分析章节结构，单线程稳定爬取，合并输出为单个 txt 文件。

小说爬虫 (Novel Crawler)

帮助用户从网页下载小说并保存为本地 txt 文件。

使用流程

获取小说 URL — 询问用户提供小说目录页或第一章的 URL
分析网站结构 — 使用 WebFetch 工具查看页面，识别章节列表和内容区域
配置爬取参数 — 确定起始章节、结束章节（可选）
执行爬取 — 单线程顺序获取各章节内容
保存文件 — 合并所有章节为单个 txt 文件

爬取策略

第一步：分析页面结构

使用 WebFetch 获取页面内容，重点关注：

章节列表的 CSS 选择器（通常在 <ul>、<dl>、.catalog、.chapter-list 等容器中）
章节链接的格式（相对路径或绝对 URL）
正文内容的容器（通常是 .content、.chapter-content、#content、<article> 等）

第二步：提取章节列表

# 常见的章节列表选择器模式
chapter_selectors = [
    '.catalog li a',
    '.chapter-list a',
    '.listmain dd a',
    '#list dl a',
    'ul.chapters a',
    '.mulu li a',
    'a[href*="read"]',
    'a[href*="chapter"]',
]

第三步：内容提取

正文内容通常需要：

移除广告元素（.ad、.ads、.script）
移除导航链接（"上一章"、"下一章"、"返回目录"）
清理多余空白行
保留段落结构

# 常见正文选择器
content_selectors = [
    '.content',
    '.chapter-content',
    '#content',
    '.read-content',
    '.text',
    '#booktext',
    '.novel-content',
    'article',
]

实现脚本

使用 scripts/novel_crawler.py 脚本执行实际爬取任务：

python scripts/novel_crawler.py <config_json>

配置文件格式：

{
  "base_url": "https://example.com/novel/123/",
  "chapter_links": ["/novel/123/1.html", "/novel/123/2.html", ...],
  "title": "小说标题",
  "author": "作者名（可选）",
  "start_chapter": 0,
  "end_chapter": -1,
  "output_path": "./小说标题.txt",
  "content_selector": ".content",
  "title_selector": "h1, .chapter-title",
  "delay": 1.0
}

爬取规范

反爬与礼仪

请求延迟：每章之间至少延迟 1-2 秒
User-Agent：使用常见的浏览器 User-Agent
失败重试：单章失败时重试 3 次，然后跳过继续
并发控制：单线程顺序爬取，避免对服务器造成压力

内容清理

移除脚本标签和样式标签
移除明显的广告文本（"本章由XX赞助"、"点击收藏"等）
保留章节标题和正文段落
统一换行格式（\n\n 分隔段落）

文件输出格式

《小说标题》
作者：XXX

==================

第一章 标题

正文内容...

==================

第二章 标题

正文内容...

边界情况处理

情况	处理方式
章节列表分页	先获取所有分页链接，合并章节列表
内容需要 JS 渲染	提示用户该网站暂不支持
需要登录/付费	检测登录提示，跳过受限章节并告知用户
编码问题	自动检测编码（UTF-8、GBK、GB2312）
反爬拦截	检测到验证码或封禁提示时暂停并告知用户

示例对话

用户: 帮我下载这个小说 https://www.example.com/novel/12345/

Claude: 我来帮你爬取这本小说。让我先分析页面结构...

[分析页面，识别章节列表和内容区域]

找到了 150 章内容。是否从第一章开始爬取全部？或者你只想爬取特定范围？

[用户确认后开始爬取]

正在爬取，每章间隔 1 秒以避免对网站造成压力... 进度: 15/150 章

[完成后]

已完成！小说《XXX》已保存到 ./《XXX》.txt，共 150 章，约 2.3 MB。