en un clic
prd-auto-test-loop
// PRD 驱动的自动化测试编排技能。用于把每版 PRD 的测试计划、AI 自测与自修复、测试报告标准化落地;适用于按验收标准拆分 Unit/Integration/E2E、划分自动化与人工边界、生成版本化 TEST_PLAN/TEST_REPORT 的场景。
// PRD 驱动的自动化测试编排技能。用于把每版 PRD 的测试计划、AI 自测与自修复、测试报告标准化落地;适用于按验收标准拆分 Unit/Integration/E2E、划分自动化与人工边界、生成版本化 TEST_PLAN/TEST_REPORT 的场景。
陪伴型 AI 人设生成与优化流程。当用户想给 Hermes Agent(或任意 AI 陪伴角色)做一个"有感情、聊久不掉、像真人"的人设时使用。通过"定调子 → 名字 → 外形 → 性格 → 背景 → 关系 → 说话节奏 → 生成 SOUL.md → 迭代"的结构化对话,从一句模糊想法(如"我想要个JK女友""年上男友""高冷御姐")产出可直接贴进 Hermes SOUL.md 的第一人称人设文本。支持女友/男友/各种气质的陪伴角色,并让用户选择"一句一句发"还是"整段说"的输出风格。当用户说"做个人设/捏个AI女友男友/给Hermes弄个角色/优化人设/换个人设"时触发。
PRD + 可执行测试用例双文档一体化协作。与用户共同写并迭代。理解需求后自主读代码再写;故事驱动 + 分阶段单点确认;每个 PRD 产出 PRD-MD 与 测试用例-MD(给 AI 的事实源)+ 两份套模板的 review HTML(给人查阅,与 MD 严格 1:1)。触发:梳理/撰写/完善 PRD、需求文档、用户故事、验收标准、测试用例、测试基准、测试方案。
系统化学习材料生成器。给一个新领域/技术/概念,AI 自主调研、搭体系、产出 HTML 学习材料(含骨架/案例/工程化/争议+盲区)。当用户说"我要学 X / 帮我系统拆解 X / 我想吃透 X 这个领域 / 给我整理 X 的全貌 / 深度调研 X 给我系统讲讲 / 把 X 搞透"时触发。不适用于"X 行不行/为什么 Y"(用 long-research)、"X 有哪些好玩案例"(用 case-radar 给散点)、"把这堆素材整理成 HTML"(用 readable-output 处理已有素材)、文章写作(用 writing-assistant)、设计稿(用 design-exploration)。
把当前对话的上下文 / 一堆历史内容 / 散落的信息**整理成可读性高的 HTML 总结**。强制 4 问挖掘(给谁看 / 读完拿什么 / 详略 / 风格)+ 6 阶段框架(定终点 → 抓核心点 → 选主结构 → 写 → 自检),让 AI "想清楚再输出",避免散文式罗列。当用户说"做个复盘"、"汇总一下"、"总结这堆"、"整理成 HTML"、"把上下文整理一份"、"做个教程 / 学习指南 / 报告"、"把 X 讲清楚"等需要把上下文/历史输出成给人读的中长 HTML 时触发。
案例雷达。给一个新东西(新工具/新概念/新生态),扫一遍生态找好玩的真实案例,重点是抓"真物"(截图/源码/演示)而不是 GitHub 主页,输出可浏览的 HTML 案例集。当用户说"看看大家用 X 做了什么"、"扫一下 X 生态"、"市面上 X 有什么新玩法"、"给我看 X 的真物案例"、"/case-radar"时触发。不适合:① 已有明确目标的深度调研(用 long-research)② 写文章/出 PRD(用 writing-assistant / prd-doc-writer)③ 单纯求知不需要 HTML(直接问就好)。
复杂长程任务的自主执行流程。当用户有一个复杂或模糊的任务("帮我搞清楚 X / 帮我评估 Y / 帮我把这堆东西整理出来 / 帮我对比 N 个方案 / 帮我跑一次调研"),希望 AI 自己拆解、自己执行、自己校验、只在关键时刻找用户的场景。通过"任务确认 → 任务队列 → 分批执行 → 周期校验队列 → 触发式汇报"实现 1-2 小时无人值守的自主执行。当用户说"帮我搞清楚 / 评估一下 / 整理一下 / 对比一下 / 跑一次调研 / 你自己跑别打扰我 / 长程任务 / 自主跑"时触发。**不适用于**:UI 设计(用 design-exploration)、待办优先级(用 priority-judge)、文章写作(用 writing-assistant)、需求池管理(用 backlog-manager)、终局发散(用 vision-exploration)、起名(用 product-naming)、有明确 spec 的实现编码任务(直接编码)。
| name | prd-auto-test-loop |
| description | PRD 驱动的自动化测试编排技能。用于把每版 PRD 的测试计划、AI 自测与自修复、测试报告标准化落地;适用于按验收标准拆分 Unit/Integration/E2E、划分自动化与人工边界、生成版本化 TEST_PLAN/TEST_REPORT 的场景。 |
使用此技能将发布测试固定为:主回归基线 + PRD 增量测试。
跨版本维护一套共享主回归测试。
每个 PRD 版本仅增加新增或变更相关用例。
将产物输出到 自动化测试/<version>/。
Unit / Integration / E2E。references/自动化测试封装指南.md 的边界章节,标记 A/H/A+H。references/自动化测试封装指南.md 的初始化命令与模板。自动化测试/<version>/,并生成 TEST_PLAN.md、TEST_REPORT.md。tests/。Unit -> Integration -> E2E。PASS 或 FAIL。TEST_PLAN 与 TEST_REPORT。A:可完全自动化H:仅人工验证A+H:自动化 + 人工联合验证# TEST_PLAN(<version>)
## 1. 测试范围
- PRD:<path>
- 范围内:
- 非范围:
## 2. 完成门槛
1. 计划内用例:<x>/<x> 通过
2. P0 用例通过率:100%
3. 连续两轮稳定通过
4. 无阻断/严重缺陷遗留
## 3. 用例清单
### Unit
- UT-xx:
### Integration
- IT-xx:
### E2E
- E2E-xx:
## 4. 执行顺序
1. Unit
2. Integration
3. E2E
4. 自动修复循环(最多 3 轮)
## 5. 输出产物
- TEST_REPORT.md
- 命令执行结果摘要
# TEST_REPORT(<version>)
## 1. 结果摘要
- 日期:
- PRD:
- 结论:PASS | FAIL
## 2. 执行命令与结果
- <command>
- result:
## 3. 分层覆盖结果
- Unit:passed/total
- Integration:passed/total
- E2E:passed/total
## 4. 失败用例
- 用例 ID:
- 现象:
- 根因:
- 修复状态:
## 5. 剩余风险(人工补测)
- 风险点:
- 自动化无法完全覆盖原因:
## 6. 发布门禁
- 门禁检查状态:
- 最终决策:
在项目根目录执行:
version="V0.6"
base_dir="自动化测试/$version"
mkdir -p "$base_dir/tests/unit" "$base_dir/tests/integration" "$base_dir/tests/e2e"
cat > "$base_dir/TEST_PLAN.md" <<'TPL'
# TEST_PLAN(V0.6)
## 1. 测试范围
- PRD:
- 范围内:
- 非范围:
## 2. 完成门槛
1. 计划内用例全部通过
2. P0 用例通过率 100%
3. 连续两轮稳定通过
4. 无阻断/严重缺陷遗留
TPL
cat > "$base_dir/TEST_REPORT.md" <<'RPT'
# TEST_REPORT(V0.6)
## 1. 结果摘要
- 日期:
- 结论:
RPT