com um clique
auto-test-code
// 当用户明确要求"测试代码"、"运行代码审查"或"进行代码自检"时使用。通过多轮 A 轮批判性代码审查 + B 轮代码质量原则检查,系统化发现、记录、修复程序代码中的问题,并将计划/过程/结果统一沉淀到目标代码根目录的 `tmp/run_{timestamp}/tests/` 隔离工作区。⚠️ 不适用:用户只是想优化功能(应直接修改)、只是询问代码问题(应直接回答)、没有明确"测试代码"意图。
// 当用户明确要求"测试代码"、"运行代码审查"或"进行代码自检"时使用。通过多轮 A 轮批判性代码审查 + B 轮代码质量原则检查,系统化发现、记录、修复程序代码中的问题,并将计划/过程/结果统一沉淀到目标代码根目录的 `tmp/run_{timestamp}/tests/` 隔离工作区。⚠️ 不适用:用户只是想优化功能(应直接修改)、只是询问代码问题(应直接回答)、没有明确"测试代码"意图。
当用户明确要求"初始化项目"、"创建项目指令文件"或"生成 AGENTS.md"时使用。完全自动化:自动检测操作系统默认语言,分析项目目录结构(支持 Python/Web/Rust/Go/Java/数据科学/文档项目等),推断项目类型和用途,一键生成规范的项目指令文档。生成结果包括:AGENTS.md(跨平台通用项目指令,Single Source of Truth)、CLAUDE.md(Claude Code 特定适配,通过 @./AGENTS.md 引用)、README.md(项目介绍与使用方法)、CHANGELOG.md(项目变更记录)、.gitignore(Git 忽略规则,安全优先),并在完整初始化时自动补齐 `docs/` 与 `docs/plans/`。
当需要把本仓库 pipelines/skills 下的所有 skills 安装到系统级(默认同时安装到 Codex: ~/.codex/skills 和 Claude Code: ~/.claude/skills),以便在任意项目/对话中可被发现与调用时使用。使用 MD5 哈希进行版本控制,仅安装有更新的 skills;支持 --skill 指定单个或少量技能安装/更新、强制覆盖安装、指定单一目标安装和远程安装模式(--remote --check/--auto)。
当用户明确要求"使用 awesome-code / 多代理协作 / 并行协调开发"时使用。通过脚本收集可用 Agent 摘要、配置约束与 `dispatch_gate`,再由 AI 自主判断 single-pass / focused-agent / parallel / sequential 策略并选择子代理;当配置中的 required route agent 缺失时必须阻塞继续执行。⚠️ 不适用:用户仅需单一角色的简单修改或咨询、用户未明确表达多代理协作意图、用户只是了解技能概念。
Use when completing tasks, implementing major features, or before merging to verify work meets requirements - reviews implementation against plan or requirements with severity分级(Critical/Important/Minor). NO MERGE WITHOUT CODE REVIEW FIRST.
Use when encountering any bug, test failure, or unexpected behavior, before proposing fixes - four-phase framework (root cause investigation, pattern analysis, hypothesis testing, implementation). NO FIXES WITHOUT ROOT CAUSE INVESTIGATION FIRST.
Use when you have a spec or requirements for a multi-step task, before touching code
| name | auto-test-code |
| category | normal |
| description | 当用户明确要求"测试代码"、"运行代码审查"或"进行代码自检"时使用。通过多轮 A 轮批判性代码审查 + B 轮代码质量原则检查,系统化发现、记录、修复程序代码中的问题,并将计划/过程/结果统一沉淀到目标代码根目录的 `tmp/run_{timestamp}/tests/` 隔离工作区。⚠️ 不适用:用户只是想优化功能(应直接修改)、只是询问代码问题(应直接回答)、没有明确"测试代码"意图。 |
| metadata | {"author":"Bensz Conan","short-description":"批判性思维驱动的代码自审查与优化流水线(多轮 A 轮静态/动态/安全分析 + B 轮代码质量原则检查)","keywords":["auto-test-code","代码审查","code review","静态分析","安全漏洞审查","代码自检"]} |
bensz-collect-bugs 规范记录到 ~/.bensz-skills/bugs/,不要直接修改用户本地已安装的 skill 源码;若有 workaround,先记 bug,再继续完成任务。gh 上传新增 bug 到 huangwb8/bensz-bugs;不要 pull / clone 整个仓库。本 skill 的交付不是"口头建议",而是一组可追溯的文件:
(目录位置以 config.yaml:directories.tmp + config.yaml:directories.tests 为准;默认 tmp/run_{timestamp}/tests/;不再使用 reviews/)
tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/:A 轮会话目录(计划/过程/结果都在这里)
REVIEW.md:A 轮批判性审查(问题清单 + 改进计划)TEST_PLAN.md:测试计划(本轮验证哪些修复点)TEST_RUN.md:测试过程(命令、关键输出摘录、关键决策)TEST_REPORT.md:测试结果(结论 + 证据 + 遗留问题)_artifacts/:中间产物(命令输出、日志、截图、对比结果等)tmp/run_YYYYMMDDHHMMSS/tests/b-vYYYYMMDDHHMM/:B 轮会话目录(结构同上,REVIEW.md 为质量检查报告)vYYYYMMDDHHMM(分钟级时间戳)tmp/run_YYYYMMDDHHMMSS/(同一次技能执行的 A/B 轮必须复用同一个 run_id)tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/tmp/run_YYYYMMDDHHMMSS/tests/b-vYYYYMMDDHHMM/verify_session.py 可识别旧目录名 tests/B轮-vYYYYMMDDHHMM/;新建统一使用 tmp/run_*/tests/b-vYYYYMMDDHHMM/reviews/ 已废弃:不再创建、不再写入;如目标项目中存在旧的 reviews/,应将其视为历史遗留并在审查时排除。tmp/run_YYYYMMDDHHMMSS/。tmp/run_*/ 工作区内。TMPDIR、XDG_CACHE_HOME、PYTHONPYCACHEPREFIX 等重定向到当前 tmp/run_*/ 工作区。tmp/run_*/ 之外的位置,以免污染源软件项目。用户输入(目标代码路径)
↓
[A轮 × N]:静态分析 → 动态推理 → 安全分类审查 → 计划 → 优化 → 轻量测试
↓
B轮:代码质量原则检查 → 针对性优化 → 轻量验证
↓
完成(文档齐全 + 问题闭环)
目标:创建本轮的 tmp/run_*/tests/ 会话骨架(计划/过程/结果都在同一目录)。
推荐使用确定性脚本:
# 在目标代码根目录内执行(选择你实际的安装路径)
RUN_ID=run_YYYYMMDDHHMMSS
python3 ~/.codex/skills/auto-test-code/scripts/create_session.py --code-root . --run-id "$RUN_ID" --kind a --id vYYYYMMDDHHMM
# 或
RUN_ID=run_YYYYMMDDHHMMSS
python3 ~/.claude/skills/auto-test-code/scripts/create_session.py --code-root . --run-id "$RUN_ID" --kind a --id vYYYYMMDDHHMM
最低要求:
tmp/run_YYYYMMDDHHMMSS/tests/ 存在tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/REVIEW.md、TEST_PLAN.md、TEST_RUN.md、TEST_REPORT.md 存在tmp/run_*/tests/ 会话目录)目标:使用批判性思维发现代码中的系统性问题,写成可执行计划,按 P0/P1/P2 排序。
输出:tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/REVIEW.md
⚠️ 批判性思维是核心要求:
references/CRITICAL_THINKING_FOR_CODE.md)质量要求(强制):
核心要求:
tmp/run_*/ 工作区中的审查文件config.yaml:a_round_check.independent_review.scan_patterns 为准)tmp/ 等 skill 产物目录,以及 node_modules/、venv/、__pycache__/ 等依赖/缓存目录;目标项目的测试代码仍属于必须审查范围config.yaml:a_round_check.dimensions 为准);不得以“本轮不聚焦”为由跳过任何维度批判性思维框架(必读):
references/CRITICAL_THINKING_FOR_CODE.md ⚠️ 核心文档,必须使用
references/A_ROUND_REVIEW_TEMPLATE.md ⚠️ 代码审查计划模板references/CODE_SMELLS.md 代码异味识别指南references/SECURITY_PATTERNS.md 安全漏洞模式库references/SECURITY_TAXONOMY.md 安全漏洞分类审查体系(必须用于安全维度)references/DESIGN_ANTI_PATTERNS.md 设计反模式识别指南tmp/run_*/tests/)目标:按计划逐项修复,并用轻量测试验证。
输出:
tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/TEST_RUN.mdtmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/TEST_REPORT.md轻量测试原则:
tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM/_artifacts/可选增强:
python3 ~/.codex/skills/auto-test-code/scripts/verify_session.py --require-review tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM
# 或
python3 ~/.claude/skills/auto-test-code/scripts/verify_session.py --require-review tmp/run_YYYYMMDDHHMMSS/tests/vYYYYMMDDHHMM
说明:verify_session.py --strict 仅用于你已将会话文档中的模板占位符全部替换后的最终自检;新建骨架默认会失败(属于预期行为)。
⚠️ 强制检查:
进入下一轮 A 轮的条件:
重要:A 轮结束后,必须进入 B 轮代码质量检查。
⚠️ 强制执行:B 轮代码质量检查是自动测试流程的强制性环节。
tmp/run_*/tests/ 会话目录)目标:对 A 轮后的最新代码做系统性质量检查。
输出:tmp/run_YYYYMMDDHHMMSS/tests/b-vYYYYMMDDHHMM/REVIEW.md
推荐使用确定性脚本创建 B 轮会话目录:
# 在目标代码根目录内执行(选择你实际的安装路径)
RUN_ID=run_YYYYMMDDHHMMSS
python3 ~/.codex/skills/auto-test-code/scripts/create_session.py --code-root . --run-id "$RUN_ID" --kind b --id vYYYYMMDDHHMM --a-test-id vYYYYMMDDHHMM
# 或
RUN_ID=run_YYYYMMDDHHMMSS
python3 ~/.claude/skills/auto-test-code/scripts/create_session.py --code-root . --run-id "$RUN_ID" --kind b --id vYYYYMMDDHHMM --a-test-id vYYYYMMDDHHMM
检查维度(以 config.yaml 的 b_round_check.dimensions 为准):
模板:templates/B_ROUND_CODE_QUALITY_TEMPLATE.md
tmp/run_*/tests/)⚠️ 强制修复要求:
完成条件:
tmp/run_*/tests/ 会话结构完整且可追溯(每轮都有 REVIEW/PLAN/RUN/REPORT + artifacts)config.yamltemplates/
templates/CODE_REVIEW_TEMPLATE.mdtemplates/B_ROUND_CODE_QUALITY_TEMPLATE.mdtemplates/SESSION_TEST_PLAN_TEMPLATE.mdtemplates/SESSION_TEST_RUN_TEMPLATE.mdtemplates/SESSION_TEST_REPORT_TEMPLATE.mdreferences/
references/CRITICAL_THINKING_FOR_CODE.md ⚠️references/A_ROUND_REVIEW_TEMPLATE.md ⚠️references/CODE_SMELLS.mdreferences/SECURITY_PATTERNS.mdreferences/SECURITY_TAXONOMY.md ⚠️references/BOUNDARY_CHECKLIST.mdreferences/DESIGN_ANTI_PATTERNS.mdscripts/create_session.pyscripts/verify_session.py