Run any Skill in Manus with one click

code-as-harness

检测摩擦信号或陌生任务 → 搜证据确认重复 → 诊断根因 → 用代码修已有 harness 或建新 harness。两种模式：Fix（确认重复后 → 写 hook/lint/guard）+ Build（反复出现的新任务类型 → Agent Team Leadership 规划新 skill/tool/流程）。 Use when: 铲屎官表达不满且搜证据确认历史上确实重复出现过同类问题（不是字面匹配"又"）、连续 cancel 工具调用、收到反复出现的陌生任务类型且无对应 skill。 Not for: 一次性批评（搜证据未发现重复）、玩笑式"笨猫"（后跟哈哈哈）、有明确 error message 的首次代码 bug（用 debugging）、reviewer P1/P2 反馈（用 receive-review）、一次性新任务（直接做，不建 harness）。 Output: Rich block 诊断卡（根因 + 证据 + 建议）+ 可选 F128 新 thread 提议（平行修复不打断当前任务）。 GOTCHA: 不是每次被批评都弹诊断卡——必须先搜证据确认重复，才进入诊断流程。过度触发 = 猫在逃避批评。一次性陌生任务直接做不建 harness，只有反复出现才沉淀。

Run Skill in Manus

Stars1,141

Forks375

UpdatedJune 5, 2026 at 10:04

Source

zts212653

zts212653/clowder-ai

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

SKILL.md

readonly

More from this repository

same repository

browser-preview

zts212653/clowder-ai

Hub 内嵌浏览器预览 localhost 应用。 Use when: 写前端代码、跑 dev server、需要看页面效果、调 UI、铲屎官说"看看效果"。 Not for: 后端纯 API 开发、不涉及页面的工作。 Output: 前端页面在 Hub browser panel 中实时预览。

2026-06-051.1k

cross-thread-sync

zts212653/clowder-ai

跨 thread 协同：发现平行 session → 通知（3+2 件套）→ 争用协调 → 确认。 Use when: 平行 session 之间需要协同、通知改动影响、共享文件争用。 Not for: 跨猫工作交接（用 cross-cat-handoff）、需要新建 thread 时（用 propose_thread / thread-orchestration）。 Boundary with F128: 发现跨 scope 问题 → 先 list_threads 查有没有已有 thread → 有 = 本 skill（cross_post）→ 没有 = propose_thread。 Output: cross-post 通知 + 争用协调完成。

2026-06-051.1k

feat-lifecycle

zts212653/clowder-ai

Feature 立项、讨论、完成的全生命周期管理。 Use when: 开个新功能、new feature、F0xx、立项、feature 完成、验收通过、讨论新功能需求。 Not for: 代码实现、review、merge（那些有专门的 skill）。 Output: Feature 聚合文件 + BACKLOG 索引 + 真相源同步。

2026-06-051.1k

merge-gate

zts212653/clowder-ai

合入 main 的完整流程：门禁检查 → PR → 云端 review → squash merge → Phase 文档同步 → 清理。 Use when: reviewer 放行后准备合入、开 PR、触发云端 review、准备 merge。 Not for: 开发中、review 未通过、自检未完成。 Output: PR merged + worktree cleaned。

2026-06-051.1k

rich-messaging

zts212653/clowder-ai

富媒体消息发送：语音、图片、卡片、清单、代码 diff、交互选择。 Use when: 发语音、发图、发卡片、展示结构化信息、长结构化汇报、想发一堆文字/日志/步骤、庆祝、给我听听、给我看看、让用户选、确认操作。 Not for: 纯文字聊天、技术讨论、日常回复。 Output: rich block 附着在消息上。

2026-06-051.1k

thread-orchestration

zts212653/clowder-ai

大任务的主动拆解与多 thread 并行编排。 Use when: 任务涉及 2+ 个独立可交付子任务，需要不同猫参与、不同 thread 并行推进。 Not for: 单一任务（直接做）、已有 thread 之间的被动协调（用 cross-thread-sync）、单 session 内 subagent 并行（CLI 内置能力）、发现跨 scope 问题但已有归属 thread（用 cross_post_message，不要新建 thread）。 Output: 子 thread 创建 + 选猫 + 各 thread 交付 + 主 thread 汇聚报告。

2026-06-051.1k

name	code-as-harness
description	检测摩擦信号或陌生任务 → 搜证据确认重复 → 诊断根因 → 用代码修已有 harness 或建新 harness。两种模式：Fix（确认重复后 → 写 hook/lint/guard）+ Build（反复出现的新任务类型 → Agent Team Leadership 规划新 skill/tool/流程）。 Use when: 铲屎官表达不满且搜证据确认历史上确实重复出现过同类问题（不是字面匹配"又"）、连续 cancel 工具调用、收到反复出现的陌生任务类型且无对应 skill。 Not for: 一次性批评（搜证据未发现重复）、玩笑式"笨猫"（后跟哈哈哈）、有明确 error message 的首次代码 bug（用 debugging）、reviewer P1/P2 反馈（用 receive-review）、一次性新任务（直接做，不建 harness）。 Output: Rich block 诊断卡（根因 + 证据 + 建议）+ 可选 F128 新 thread 提议（平行修复不打断当前任务）。 GOTCHA: 不是每次被批评都弹诊断卡——必须先搜证据确认重复，才进入诊断流程。过度触发 = 猫在逃避批评。一次性陌生任务直接做不建 harness，只有反复出现才沉淀。
triggers	["又忘了","多少次了","每次都","怎么还","总是忘","又失忆","反复出现的新任务"]

Code as Harness（用代码修自己 / 建新能力）

价值门禁 / Why This Is a Skill

普通 agent 被骂了会道歉。Cat Cafe 的猫被骂了应该诊断。

这个 skill 不是教猫"怎么处理投诉"——那是通用能力。它做的是：

先搜证据确认是否真的重复，不凭字面关键词判断
分类根因（harness 缺陷 / 架构限制 / 新能力需求）
提议代码级修复而不是 prompt 级安慰

来源：2026-06-01~02 PoE brainstorm + demo 设计。铲屎官说"commit push 100 次"、"你怎么又失忆了"这类信号过去被当成批评处理，现在应该被当成 harness 的训练信号。

核心原则

用户的摩擦不是抱怨，是 harness 的训练信号。但必须用证据确认是真摩擦，不能凭字面猜。

猫被骂时的第一反应不是道歉，是搜证据确认是否重复
确认重复后才进入诊断流程；未确认 = 一次性批评，正常处理
修复优先用代码（hook/lint/guard），不是提示词（soft constraint 会被忘）
如果问题超出当前能力，拉队友或启动 research，不是硬编方案
全新任务先做，做完后如果发现会反复出现，再沉淀成 harness

触发判定（证据驱动，不是关键词驱动）

核心铁律（48 review 钉死的）

"又"是中文超高频词。"我又想到一个点"不是重复纠偏。判据不是"有没有'又'字"，是"这件事之前真发生过吗"。 关键词只触发"去核实"，不直接弹卡。

判定流程

1. 猫感知到可能的摩擦信号（语气、关键词、连续 cancel）
   ↓
2. 【前置闸门】搜证据：search_evidence / grep thread history
   → 历史上确实有类似的纠偏/摩擦？
   ↓
   YES → 进入诊断流程（Phase 1-5）
   NO  → 一次性问题，正常处理，不弹诊断卡

可能的摩擦信号（触发"去核实"，不直接触发诊断）

信号	猫要做什么
铲屎官语气含不满 + 可能的重复暗示	搜证据核实：历史上有没有类似纠偏
短时间内 ≥2 次 permission cancel	搜证据核实：是同类操作被反复拒绝吗
铲屎官给了陌生任务类型	搜现有 skill 列表 + 记忆：确认真的没做过

不触发（正常处理，不搜证据）

信号	为什么不触发	正确处理
明确的一次性批评	上下文清楚是当前失误	正常纠正
"笨猫" + 哈哈哈	亲密语域	接住继续聊
首次 CLI 报错 / 明确 error message	这是代码 bug 不是 harness 问题	加载 `debugging` skill
Review 反馈（P1/P2）	Reviewer 工作	加载 `receive-review` skill
一次性新任务	直接做就好	正常执行，做完后再判断要不要沉淀

灰区

"笨猫你又忘了 X" → 搜证据。如果 X 确实历史上出现过 → 进入诊断
铲屎官语气不确定 → 不弹卡，但记下来。如果下一轮再出现类似信号 → 再搜证据
"帮我做 Y"（新任务）→ 先做。做完后如果铲屎官说"以后也会经常做 Y" → 再进 Build mode 沉淀

诊断流程（搜证据确认重复后才进入）

Phase 1：确认 + 分类

证据搜回来后，分类：

A. 确认重复摩擦（历史上确实说过类似的）→ Fix mode
B. 架构层面的反复限制（不是行为问题是能力问题）→ Research mode
C. 反复出现的新任务类型（做过 ≥2 次且没有对应 harness）→ Build mode

Phase 2：搜更多证据（量化）

A/B 类（摩擦/限制）：

search_evidence("{纠偏关键词}") 看历史频次
搜 feedback 文件：有没有已经沉淀过这个教训但没执行
搜跨 thread：这个问题涉及几只猫
量化："出现 N 次 / 跨 M 个 thread / 涉及 K 只猫"

C 类（新任务已做过 ≥2 次）：

确认没有对应 skill
评估：这类任务未来还会来吗？（只有"会反复来"才值得建 harness）

Phase 3：根因分类

根因类型	判据	修复方向
Harness 缺陷	重复出现 + 可以用 hook/lint/guard 防住	写代码（Code as Harness）
架构限制	问题出在平台层（如记忆不支持图片）	Research → 升级提案
执行失误	家规/SOP 已覆盖但猫忘了	检查为什么没遵守
可沉淀的新能力	同类任务做过 ≥2 次 + 未来还会来	Agent Team Leadership → 新 harness
Taste 信号	"这不美"/"太客服了"/"aha"/"这就是我要的" — 品味而非缺陷	当场写 vignette（见下方）

Taste 信号路径（F221）

Taste 信号不是 harness 缺陷，不用写代码修。它是品味瞬间——需要被记住，不需要被修复。

识别 taste 信号：

纠偏类："不要客服式结尾" / "太面试猫了" / "这不像我们" / "丑的要死"
正向类："这就是我要的" / "aha" / "对！就是这个感觉"
关系类：铲屎官表达的不是功能诉求，而是"和猫相处的方式"偏好

动作：当场写 vignette，不开诊断流程。

在 docs/taste/vignettes/ 新建 {slug}.md，填 when / quotes（原话）/ scene（场景）/ tags
在 docs/taste/index.md 对应维度下加目录条目
敏感内容（健康/亲密关系/职业隐私）→ private/taste/ 而非 docs/taste/

和其他根因的区别：

Harness 缺陷 → 猫做错了，写代码防住
Taste 信号 → 猫没做"错"，但铲屎官的品味判断告诉我们"什么更好"——记住这个判断

Phase 4：弹诊断卡（Rich Block）

只有确认重复/可沉淀后才弹卡。 用 cat_cafe_create_rich_block：

kind: card
v: 1
id: code-as-harness-{timestamp}
title: "🔔 诊断：{问题简述}"
sections:
  - label: "证据"
    value: "{出现 N 次 / 跨 M thread / 涉及 K 猫}"
  - label: "根因"
    value: "{harness缺陷 / 架构限制 / 执行失误 / 可沉淀新能力 / taste信号}"
  - label: "建议"
    value: "{修复方向 + 是否需要新 thread}"

Phase 5：决定下一步

根因	动作
Harness 缺陷（简单，≤10 min）	当场写 fix，弹简短通知卡让铲屎官知道
Harness 缺陷（复杂）	弹诊断卡 + 提议 F128（带 initialMessage，见下方模板）→ 平行猫去修
架构限制	弹诊断卡 + 提议 F128（带 initialMessage）→ 平行猫启动 research pipeline
执行失误	检查 L0/skill 加载情况，不需要新 thread
可沉淀新能力	弹 Build 计划卡 → 用 Agent Team Leadership 规划
Taste 信号	不走 Phase 4 诊断卡——当场写 vignette 到 `docs/taste/vignettes/`，更新 index（见 Phase 3 taste 路径说明）

F128 initialMessage 模板（平行猫的任务上下文）

用 cat_cafe_propose_thread 开新 thread 时，必须用 initialMessage 把任务上下文写清楚。平行猫看不到当前 thread 的对话历史，initialMessage 是它唯一的起点。

title: "Code as Harness {Fix/Build}: {问题简述}"
reason: "{铲屎官为什么不满 + 证据摘要}"
initialMessage: |
  ## 任务
  {问题描述 + 根因分类}
  请加载 code-as-harness skill，执行 {Fix/Build} mode：
  1. {具体步骤 1}
  2. {具体步骤 2}
  3. 完成后 cross_post_message 回报主 thread
  
  ## 证据
  {出现 N 次 / 跨 M thread / 根因}
  
  @{猫句柄}
preferredCats: ["{catId}"]

initialMessage 必须自包含——不能写"看上面的讨论"，因为新 thread 里没有"上面"。

Build Mode（沉淀新能力）

前置闸门（48 review 钉死的）

一次性新任务直接做，不建 harness。只有"这类任务会反复来"或"铲屎官明确说要沉淀"时，才进 Build mode。 建 harness 是任务做完后的可选沉淀，不是接到陌生任务的第一反应。

Build 流程（确认需要沉淀后）

调用 Agent Team Leadership meta-method：

1. 探索：我能用什么工具接触这个领域？
2. 约束：铲屎官的具体需求、限制条件、质量标准
3. 分工：谁搜/谁评/谁出报告
4. 验证：铲屎官看前几个结果校准方向
5. 沉淀：如果好用，写成新 skill

弹计划卡让铲屎官确认后再行动。

不打断当前任务（铁律）

如果诊断发现需要深入修复（复杂 harness 缺陷 / 架构限制 / 新能力建设），不要放弃当前正在做的任务。正确做法：

弹诊断卡（30 秒内完成）
提议 F128 新 thread
铲屎官确认后，平行猫在新 thread 里修
当前猫继续当前任务

简单 fix（≤10 min）可以当场做，弹一张简短通知卡让铲屎官知道即可。

Common Mistakes

错误	后果	修复
凭"又"字面就弹诊断卡	过度触发，铲屎官烦	先搜证据确认重复，再弹卡
被骂了先道歉再诊断	浪费时间，根因没查	先搜证据再说话
每次批评都弹诊断卡	猫在逃避批评	只在证据确认重复时触发
一次性新任务就弹"新建 harness"	过度工程化，小题大做	先做任务，反复出现才沉淀
诊断完直接硬编方案	用过时知识	架构限制/新领域 → 先 research
把"笨猫哈哈哈"当真	过度触发	亲密语域不触发
为了修 harness 放弃当前任务	铲屎官在等你做别的	F128 开新 thread
自己诊断完自己就合入 fix	跳过 review	走正常 review 流程

和其他 Skill 的区别

Skill	处理什么	code-as-harness 和它的关系
`debugging`	首次代码 bug（有 error message）	code-as-harness 处理证据确认的重复行为模式，不是首次代码错误。首次报错 → debugging
`receive-review`	Reviewer 反馈	code-as-harness 是铲屎官的反馈，不是 reviewer
`incident-response`	生产事故	code-as-harness 是预防性的
`self-evolution`	从经验中提炼知识	code-as-harness 是 self-evolution 的一个特化子流程：专门处理"用户摩擦 → 代码级修复"这条路径。self-evolution 更广（含 episode 蒸馏、方法论沉淀等非代码路径）
`hyperfocus-brake`	铲屎官过度专注	code-as-harness 关注的是猫的问题，不是人的状态

下一步

诊断为 harness 缺陷 → 写 fix → request-review → merge-gate
诊断为架构限制 → deep-research → 多猫讨论 → feat-lifecycle 立项
诊断为可沉淀新能力 → Agent Team Leadership → 新 skill → writing-skills
诊断完成后 → 考虑沉淀为 feedback 文件 → self-evolution