con un clic
chapter-scan
// 逐章反思,一次只扫一章,发现原文章节中遗漏的实体页面和改进建议。工作目录:/home/baojie/work/knowledge/honglou。
// 逐章反思,一次只扫一章,发现原文章节中遗漏的实体页面和改进建议。工作目录:/home/baojie/work/knowledge/honglou。
| name | chapter-scan |
| description | 逐章反思,一次只扫一章,发现原文章节中遗漏的实体页面和改进建议。工作目录:/home/baojie/work/knowledge/honglou。 |
一次只扫一章,绝对禁止合并多章处理。
每次调用只处理进度文件中的下一章,完成后更新进度,等待下次调用。
/home/baojie/work/knowledge/honglou
语料:corpus/红楼梦.txt(简体中文,程甲本 120 回)
章节页:wiki/public/pages/第NNN回.md
步骤 1 · 检查进度
──────────────────────────────────
cat wiki/logs/chapter_scan_progress.json 2>/dev/null || echo "{\"next\": 1, \"done\": []}"
→ 获取 next 字段(下一章章回号,1–120)
→ 若 next > 120 → 报告已全部完成,停止
步骤 2 · 获取本章信息
──────────────────────────────────
CHAPTER=$(printf "第%03d回" $NEXT)
cat wiki/public/pages/${CHAPTER}.md | head -5 # 确认章节存在
步骤 3 · Claude 实体反思(核心步骤)
──────────────────────────────────
仔细阅读章节页全文,识别所有**具名实体**:
扫描维度:
A. 人物姓名 — 有姓名的角色(含配角、一次性人物)
B. 组织机构 — 府邸、书社、机构名称
C. 地名/居所 — 建筑、园子、具体房间、地名
D. 器物/珍宝 — 有名字的器物、首饰、书画
E. 概念/典故 — 诗词名、成语、典故、判词
F. 事件 — 有专名的重要情节(省亲、葬花、抄检大观园)
**识别规则**:
- 凡文中出现的专有名词,无论是否已有 [[wikilink]] 标记
- 重点关注**没有** [[...]] 标记的专名
- 跳过:过于泛化的词("官员"、"丫鬟"、"客人"等)
步骤 4 · 逐一核查
──────────────────────────────────
对识别出的每个实体候选:
a. 检查 pages.json alias_index 是否存在:
python3 -c "
import json
ai = json.load(open('wiki/public/pages.json'))['alias_index']
for name in ['实体A', '实体B']:
print(name, '→', ai.get(name, 'MISSING'))
"
b. 若 MISSING:运行 corpus_search 评估引用量:
python3 wiki/scripts/butler/corpus_search.py "实体名" --max 8
c. 按命中数分类:
- ≥5 hits → P1(重要遗漏,优先建页)
- 2-4 hits → P2(有价值,建 stub)
- 1 hit → P3(次要)
- 0 hits → 跳过
步骤 5 · 输出反思报告
──────────────────────────────────
格式:
## 📖 第NNN回 反思报告
### 遗漏实体
| 实体 | 类别 | corpus命中 | 建议 |
|------|------|-----------|------|
| XX | 人物 | 7 | P1 新建 |
| YY | 地点 | 3 | P2 stub |
### 现有遗漏(需改进但非新页)
- 现有 XX 页缺少本章引文 (NNN-PPP)
### 判断为"无需建页"的候选
- AAA(过于泛化)
步骤 6 · 写入队列(仅P1/P2)
──────────────────────────────────
对 P1/P2 实体,追加至 wiki/logs/butler/queue.md:
格式:`- [ ] P<级别> create | <实体名> | 来自第NNN回章节反思`
步骤 7 · 更新进度
──────────────────────────────────
python3 -c "
import json, os
f = 'wiki/logs/chapter_scan_progress.json'
d = json.load(open(f)) if os.path.exists(f) else {'next': 1, 'done': []}
d['done'].append(d['next'])
d['next'] = d['next'] + 1
json.dump(d, open(f,'w'), ensure_ascii=False, indent=2)
print(f'进度更新:下一章 第{d[\"next\"]:03d}回')
"
✓ 已扫描 第NNN回(NNN/120 章)
发现遗漏:X 个(P1:N P2:N P3:N)
加入队列:N 个
下一章:第MMM回
| 参数 | 说明 |
|---|---|
/chapter-scan | 处理进度文件中的下一章 |
/chapter-scan 27 | 强制扫描第027回(不推进进度) |
/chapter-scan --reset | 重置进度到第001回(慎用) |
升级红楼梦 wiki 页面质量一档。五级阶梯:stub→basic→standard→featured→premium。诊断页面当前指标缺口,执行对应补充操作(补PN引文、写散文、加节)。当用户说 /enrich PAGE 或 /enrich PAGE 目标档 时触发。
启动红楼梦 Wiki 管家永续 loop。三队列系统(content/housekeeping)。每轮:W1三队列选任务→W2执行→W3自评→记账,无需用户逐轮确认。每11轮discover+housekeeping-scan,每17轮自动/wiki发布,每29轮W5反思,每37轮H17覆盖扫描。工作目录:/home/baojie/work/knowledge/honglou。支持 --focus 参数指定任务范围(多实例并发时使用)。
系统性诊断和纠正错误。当用户报告任何 bug、视觉异常、内容错误时执行此 skill。基于 wiki/doc/why.md 记录的根因模式进行排查。
红楼梦 Wiki 编委审稿:检查近期 butler 工作是否违反质量规范,输出分级违规报告,给出具体纠正建议。工作目录:/home/baojie/work/knowledge/honglou。
一键发布红楼梦 Wiki:重建注册表 → 重算质量分 → 同步 docs/ → git commit → git push。此 skill 明确授权自动 commit 和 push,覆盖项目 CLAUDE.md 中的禁止自动提交/推送限制。
从红楼梦 Wiki 随机抽取 1-3 个页面作为灵感种子,到网上搜索相关分析文章,发现 Wiki 真正的缺口并补齐。可接受参数指定灵感方向。标准模式写作严格限于红楼梦原文;--ext 模式允许为原文引用的现实作者/典故建页,可补充外部背景知识。工作目录:/home/baojie/work/knowledge/honglou。