com um clique
self-retrospective
// Agent 自我复盘:读取 L2/L3/L1 日志,调用 LLM 生成结构化改进提案, 写入 proposals.json 并发通知至 human.json 等待审批。 适用场景:Agent 在完成足够多任务后,触发自我评估和改进提案生成。
// Agent 自我复盘:读取 L2/L3/L1 日志,调用 LLM 生成结构化改进提案, 写入 proposals.json 并发通知至 human.json 等待审批。 适用场景:Agent 在完成足够多任务后,触发自我评估和改进提案生成。
技术设计文档 SOP——从需求到设计方案,产出 Markdown 文件到 /workspace/output/
Manager 团队复盘:聚合所有 Agent 的 L2 质量指标,统计 L1 人类纠正事件, 识别瓶颈 Agent 并触发其自我复盘,调用 LLM 生成团队级改进提案, 向 human.json 发送周报。
审批复盘提案(Manager 专用)。收到 type=retro_report 邮件时加载此 Skill。按改动深度分档,memory 自动批准(加闸门),skill/agent 转 Human 确认,soul 标记高风险转 Human。
团队复盘思考框架(Manager 专用)。当你收到 type=team_retro_trigger 的邮件、或被要求"做团队复盘"时加载此 Skill。从聚合视角分析全员数据,发现跨 Agent 问题,级联触发瓶颈 Agent 的自我复盘,发周报给 Human。
自我复盘思考框架。当你收到 type=retro_trigger 的邮件、或被要求"反思本周工作"/"自我复盘"时加载此 Skill。用 log_query CLI 查数据,用 LLM 推理做分析,产出结构化复盘报告和改进提案。
初始化共享工作区,第27课新增 sop/ 目录和 human.json 邮箱。新项目启动时由 Manager 调用。
| name | self-retrospective |
| description | Agent 自我复盘:读取 L2/L3/L1 日志,调用 LLM 生成结构化改进提案, 写入 proposals.json 并发通知至 human.json 等待审批。 适用场景:Agent 在完成足够多任务后,触发自我评估和改进提案生成。 |
| type | task |
PM Agent 执行自我复盘时,调用本 Skill 分析历史日志并生成结构化改进提案:
/mnt/shared/proposals/proposals.json/mnt/shared/mailboxes/human.json 等待审批脚本路径:/mnt/skills/self-retrospective/scripts/self_retro.py
# 先确保依赖已安装
pip install openai filelock -q
# 执行自我复盘
python3 /mnt/skills/self-retrospective/scripts/self_retro.py \
--logs-dir /mnt/shared/logs \
--mailbox-dir /mnt/shared/mailboxes \
--agent-id pm \
--days 7 \
--min-tasks 5
参数说明:
--logs-dir:日志根目录(固定为 /mnt/shared/logs)--mailbox-dir:邮箱目录(固定为 /mnt/shared/mailboxes)--agent-id:执行复盘的 Agent 标识(如 pm)--days:回看天数,默认 7--min-tasks:最小样本量阈值,低于此值跳过复盘,默认 5环境变量:ALIYUN_API_KEY(沙盒已注入)
{
"errcode": 0,
"errmsg": "success",
"proposals_count": 2,
"skipped": false,
"proposals": [
{
"type": "sop_update",
"target": "pm/sop/design_spec_sop.md",
"root_cause": "prompt_ambiguity",
"current": "验收标准缺少移动端适配要求",
"proposed": "在 SOP 验收清单中增加「移动端响应式」检查项",
"expected_metric": "checkpoint 通过率从 45% 提升到 75%",
"rollback_plan": "删除新增检查项,恢复原 SOP",
"evidence": ["t001", "t003"],
"priority": "high"
}
]
}
样本量不足时:
{
"errcode": 0,
"errmsg": "success",
"proposals_count": 0,
"skipped": true,
"reason": "任务数 3 < 最小样本量 5"
}
你必须通过 sandbox_execute_bash 实际运行 Python 脚本。
expected_output 字段猜测结果errcode=1:缺少 ALIYUN_API_KEY 环境变量errcode=2:LLM 调用失败(网络、API Key 无效等)skipped=true:样本量不足,非错误,正常跳过