一键导入
bug-hunter-stage2-parallel-review
// bug-hunter 阶段 2 技能。负责将随机化后的 diff 按 persona 矩阵分发给 8 个子智能体并行评审,并收集统一 JSON 结果。
// bug-hunter 阶段 2 技能。负责将随机化后的 diff 按 persona 矩阵分发给 8 个子智能体并行评审,并收集统一 JSON 结果。
| name | bug-hunter-stage2-parallel-review |
| description | bug-hunter 阶段 2 技能。负责将随机化后的 diff 按 persona 矩阵分发给 8 个子智能体并行评审,并收集统一 JSON 结果。 |
本阶段必须使用 Agent 工具并行启动 8 个子智能体,严禁手工编写 findings!
Agent 工具至少 8 次descriptionshuffled_passes.json 的 passes[*] 中随机选择 1 个 pass 作为输入raw_findings.json如果 raw_findings.json 是手工编写的(而非从 8 个 Agent 收集),后续阶段将拒绝处理。
读取 Stage 1 输出的 shuffled_passes.json
要求:
passes[*].diff 中选取评审输入pass_id在单次响应中并行调用 Agent 工具 8 次,每个使用不同的 persona 提示词。
每个 Agent 必须同时满足:
推荐 persona 关注点:
Security Sentinel
重点看权限边界、输入校验、越界访问、信息泄漏、路径遍历、注入面。Concurrency Engineer
重点看锁顺序、竞态、原子性、可见性、死锁、丢唤醒。Performance Analyst
重点看热点路径、复杂度、无谓拷贝、阻塞等待、缓存失效。Diverse Reviewer A
重点看核心逻辑正确性、状态迁移、条件分支遗漏。Diverse Reviewer B
重点看边界条件、空值/极值、长度与容量、资源上限。Diverse Reviewer C
重点看错误处理、返回码传播、回滚与清理路径。Diverse Reviewer D
重点看 Linux 语义一致性、接口契约、行为兼容性。Diverse Reviewer E
重点看资源生命周期、引用关系、释放时机、泄漏风险。agentpass_id 作为调试元数据;后续脚本会忽略未知字段{"schema_version":"1.0","findings":[...]} 包装对象artifacts/raw_findings.json推荐输出结构:
{
"schema_version": "1.0",
"findings": [
{
"file": "kernel/src/foo.rs",
"line": 42,
"type": "logic",
"severity": "major",
"description": "error path forgets to release inode reference",
"fix_code": "drop(inode);",
"confidence": 0.81,
"agent": "Diverse Reviewer E",
"pass_id": 3
}
]
}
每个 Agent 必须返回纯 JSON 数组:
[
{
"file": "path/to/file.py",
"line": 42,
"type": "security|concurrency|performance|logic",
"severity": "critical|major|minor",
"description": "问题描述",
"fix_code": "修复代码片段",
"confidence": 0.9,
"agent": "Security Sentinel"
}
]
shuffled_passes.json 中抽样输入,而不是直接评审原始 difffile:line[0, 1]agent 字段必填,值必须是当前角色名专用于按照 docs/introduction/develop_nix.md 的流程,通过 Nix dev shell / yolo 命令启动 DragonOS,并在 QEMU nographic 串口中做启动烟雾检查或实时轮询回贴输出。当用户要求“按 develop_nix 跑 yolo”“用 nix yolo 启动 QEMU 看输出”“边跑边轮询输出”“进 guest 后检查 /proc、/sys/fs/cgroup、mount 是否正常”时使用。
分布式多智能体缺陷检测总控技能。基于输入随机化、角色化并行评审、语义桶化、加权共识与裁决复核输出高信噪比代码评审报告。用于大规模 PR、复杂逻辑变更、安全敏感改动或单智能体评审召回率不足的场景。
bug-hunter 阶段 1 技能。负责提取代码改动、执行敏感信息脱敏,并按文件/代码块生成多轮随机化输入以缓解 LLM 位置偏差。
bug-hunter 阶段 3 技能。负责对多智能体原始发现做语义去重、桶化聚类与冲突识别,形成可投票的缺陷候选池。
bug-hunter 阶段 4 技能。负责对缺陷桶执行加权共识投票,筛选过阈值问题,并输出裁决级结构化评审报告。
使用低扰动原子快照、GDB 现场采样和语义对比来调试 DragonOS 内核中的时序问题、Heisenbug、阻塞挂起、丢唤醒和“加日志现象改变”的问题。适用于网络、VFS、调度、IPC、驱动等子系统;当用户提到任务卡住、CPU idle 但请求不返回、阻塞点偶发失效,或明确要求在线取证且不想依赖高频日志时使用。