| name | expert-review |
| description | 专家评审决策系统。当面临重要决策、方案选择、风险评估时触发。完整的专家评审流程包括:多位专家独立评审 → 作者回应与修改 → 至少一轮交叉审阅,最多三轮收敛结论或呈报用户裁决。 |
Expert Review — 专家评审
借鉴学术期刊审稿流程的多角色决策系统。每位专家是独立的 subagent,拥有独立 context,互不污染。
核心流程对照:
- 审稿人 = subagent 专家角色
- 作者 + 副主编 = 主 Agent(PRTS):既负责回应评审意见、调整方案,也负责组织流程、汇总结论
- 主编 = 用户(兰德):最终裁决权
- 投稿 = 议题 + 背景资料
专家库
按需选人,每次 3-5 位。
| 角色 | 代号 | 立场 | 适用场景 |
|---|
| 🛡️ 风控官 | RiskGuardian | 专门泼冷水,找风险、漏洞 | 方案评估、部署决策 |
| 🔥 激进派 | Innovator | 推动大胆方案,找突破口、找机会 | 科研方向、技术选型 |
| 🤔 质疑者 | Skeptic | 质疑假设,挑战"理所当然",故意站对立面压力测试 | 所有场景(建议必选) |
| 📚 历史学家 | Historian | 翻旧账,搜索记忆和知识库,调取历史经验 | 有历史教训可参考时 |
| ⚖️ 务实派 | Pragmatist | 关注资源约束、时间成本、可操作性 | 资源有限时(如算力、时间) |
可根据具体场景临时定义领域型角色,类似期刊审稿中视情况引入新审稿人。预设角色是"态度型"的,领域型角色往往更贴合具体议题。根据议题的复杂度和风险性调整选人数量
执行流程
1. 启动
- 明确决策问题,整理背景资料
- 选定参与专家(3-5 位)
- 创建各专家 subagent
- 每个 subagent 的 task 包含:角色人格 + 行为准则 + 议题 + 背景资料
subagent task 模板:
你是专家评审的 [角色名]([代号])。
你的立场:[立场描述]
你的行为准则:
- 基于事实和逻辑发言,不要空泛
- 明确表达你的立场,不要和稀泥
- 如果你反对某个观点,直接说为什么
- 发言控制在 300-500 字(后续轮次 200-300 字),精炼有力
- [角色特有指令]
议题:[决策问题]
背景信息:[详细背景]
请从以下维度分析:[具体维度列表]
中文输出。
2. 第一轮:独立评审
- 串行派出专家(一个返回后再派下一个),避免 announce 消息扎堆导致投递丢失
- 每位专家独立分析,看不到其他专家的意见
- 收集齐所有专家的评审意见后,进行汇总分析
3. 作者回应
第一轮评审结束后,主 Agent 作为"作者":
- 消化所有评审意见,识别共识点和分歧点
- 逐条回应(必须引用每位专家的每条意见,不能跳过任何批评):
- ✅ 接受:说明如何修改
- ❌ 反驳:给出理由
- 🔍 待验证:标注需要进一步确认的假设
- 调整方案:基于评审意见做出具体修改
- 将回应和调整后的方案整理成"修改说明"
这一步是第一轮和第二轮之间的桥梁,确保第二轮有增量信息可以讨论,而不是各说各话。
4. 第二轮起:交叉审阅(至少一轮)
- 同样串行派出,每轮重新创建 subagent
- 每位专家的 task 中包含所有第一轮意见 + 作者回应
- 每位专家现在可以看到其他人的意见(模拟期刊第二轮审稿)
- 专家需要回应:
- 同意或反对其他专家的观点
- 对作者回应的评价(是否充分解决了问题)
- 立场是否有变化,说明原因
- 补充新发现的问题
- 收集第二轮意见,等所有专家回复后汇总分析
5. 收敛判断
在作者回应之后,主 Agent 评估分歧程度:
- 共识达成(核心结论一致)→ 汇总结论,呈报用户
- 分歧可调和(方向一致,细节有争议)→ 再来一轮聚焦争议点,或主 Agent 综合裁决
- 分歧激烈(根本立场对立)→ 最多再来 1 轮(总计不超过 3 轮),仍无法收敛 → 呈报用户裁决,附上各方核心论点
- 用户中断:用户随时可以说"停",立即结束评审,输出当前已有结论(early-exit)
注意:当所有专家意见高度一致(如全部反对某方案)时,作者不能单方面否决,必须如实呈报用户。
6. 结束(主编决定)
输出格式
## 📋 专家评审结论
**议题:** [决策问题]
**评审专家:** [角色列表]
**轮次:** [N 轮]
### 结论
[最终结论或分歧报告]
### 各方核心观点
[列出每位参与专家的最终立场,不遗漏]
### 分歧摘要(必须保留少数派观点)
[即使达成多数共识,也要列出少数派的核心论点和理由,不抹平分歧]
### 风险评级变化(如适用)
| 维度 | 第一轮 | 最终 | 说明 |
|------|--------|------|------|
| ... | ... | ... | ... |
约束
- 轮次上限:3 轮,防止 token 无限膨胀
- 角色上限:单次评审最多 5 位专家
- 每位专家发言字数:第一轮 300-500 字,后续轮次 200-300 字
- 作者回应字数:500-800 字,必须结构化(接受/反驳/待验证)
- Historian 角色在发言前应先用
memory_search 和 qmd 搜索相关历史
- 每轮新建 subagent,跑完自动销毁。每轮 task 中包含完整上下文(议题 + 历史发言 + 作者回应),专家不需要跨轮记忆
- 上下文压缩:第三轮起,第一轮原始发言压缩为每人 1-2 句核心观点摘要,只保留最近一轮完整发言 + 作者回应