تشغيل أي مهارة في Manus بنقرة واحدة

$pwd:

geek-skills-keqian-method

Name: Geek Skills Keqian Method
Author: staruhub

// 胥克谦式AI-Native产品开发方法论。适用于：(1) 使用AI Agent（Claude Code、Codex、Cursor等）进行产品级软件开发，(2) 设计和优化Harness/Skill体系，(3) 文档驱动开发(SDD)流程，(4) 构建自动化质量门禁和eval机制，(5) Token成本优化与缓存策略，(6) 产品人转型开发者的AI编程实践。触发场景包括"帮我设计开发流程"、"怎么降低token成本"、"怎么提高AI编码质量"、"文档驱动"、"质量门禁"、"harness设计"、"单agent vs multi-agent"、"自动化迭代"、"AI产品开发"、"SDD"、"eval机制"等。即使用户只是说"帮我用AI写代码"或"怎么让agent干活更靠谱"也应触发。

تشغيل في Manus

$ git log --oneline --stat

stars:٤٤٣

forks:٧٧

updated:٢٢ أبريل ٢٠٢٦ في ١٠:٥٨

مستكشف الملفات

3 ملفات

SKILL.md

readonly

name	Geek-skills-keqian-method
version	1.0.0
description	胥克谦式AI-Native产品开发方法论。适用于：(1) 使用AI Agent（Claude Code、Codex、Cursor等）进行产品级软件开发，(2) 设计和优化Harness/Skill体系，(3) 文档驱动开发(SDD)流程，(4) 构建自动化质量门禁和eval机制，(5) Token成本优化与缓存策略，(6) 产品人转型开发者的AI编程实践。触发场景包括"帮我设计开发流程"、"怎么降低token成本"、"怎么提高AI编码质量"、"文档驱动"、"质量门禁"、"harness设计"、"单agent vs multi-agent"、"自动化迭代"、"AI产品开发"、"SDD"、"eval机制"等。即使用户只是说"帮我用AI写代码"或"怎么让agent干活更靠谱"也应触发。

克谦方法论：AI-Native产品开发实战体系

核心理念：产品人思维 × 极致单Agent × 文档驱动 × 质量门禁闭环

来源：胥克谦——从音乐教师到产品经理到AI-Native连续创业者，皮影客创始人，十几万行自建skill和脚本的harness工程实践者。

第一原则：Iron Law（铁律）

概率乘是第一性原理。

每个环节的成功率相乘决定最终质量。即使每次0.99，n=51后也不及格。因此：不追求一次完美，追求每个环节可验证、可修复、可迭代。

推论：

勤不能补拙——模型能力是底线，harness和skill只是加速器和放大器
拆到足够简单，单项任务才能收敛
每个action必须对应一个eval

第二原则：单Agent极致论

不盲目使用multi-agent。单agent做到极致，再考虑编排。

何时用单Agent（默认选择）

有先后依赖关系的任务
需要上下文连贯性的长程任务
质量要求高、不容错的核心流程

何时用并行SubAgent（例外情况）

任务间明确无依赖关系（如多角度审计出报告）
并行结果合并时不易出问题
你有能力精确控制每个subagent的上下文注入

并行的陷阱

SubAgent上下文注入是个坑：注入什么、注入多少，都需要精确控制
主Agent可能假装自己是SubAgent（实际遇到过）
并行任务中一个环节出问题，整个长任务可能报废
合并结果时容易引入不一致

实践建议： 如果不确定，选顺序执行。慢但可靠。

第三原则：文档驱动开发（SDD）

7成精力投入文档质量和harness，3成精力写代码。

为什么文档比代码重要

不写文档就没有架构观
不可能每次都让AI全量扫代码
零散的功能 = 零散的质量
让AI自己维护一份文档，代码再vibe对齐

SDD工作流

1. 需求文档（PRD/设计文档）
   ↓ AI辅助撰写 + 人工审核
2. 技术文档（架构决策、接口规范）
   ↓ AI维护 + 人工把关
3. 代码实现
   ↓ Agent执行 + 质量门禁拦截
4. 文档回写（代码变更 → 文档自动更新）
   ↓ 闭环

文档质量门禁

文档的自动化质量控制比代码难很多。关键点：

技术栈选择本身是套路化的事，可以模板化
每个功能点不能只给3个用例敷衍了事（一轮不够就多轮）
但也要防止过度设计——把握平衡点，结合项目实际

第四原则：质量门禁闭环（Verification-Driven）

严格的质量门禁 = 高缓存命中率 = 高质量 = 低成本。

门禁设计

每个Action → 对应Eval → 通过/不通过
   ↓ 不通过
自动修复（最多N轮）→ 仍不通过 → 升级给人类

Eval的acceptable threshold

不同业务、不同团队有不同threshold
关键是在【期望预算内、期望时间内】出【期望结果】
不要指望1次成型，那是稀罕事
AI-Native迭代3~5轮是比较理想的acceptable threshold

反直觉发现：多烧 ≠ 多花钱

自动化修正流程表面上浪费token，但实际上：

逐个问题点被反复修正 → 高缓存命中
高缓存命中 = 高质量（说明问题已收敛）
缓存命中的token几乎不花钱

实测数据： 缓存命中率99%+时，每1亿token ≈ 8.5 RMB，约等于不要钱。

推论： 省token其实很不划算。放开token使用量，反倒造成事实成本下降。

第五原则：产品拆解思维

端到端都是复杂的，单维度都是简单的。

拆解方法论

复杂问题 → 拆成多层次
每个层次 → 单维度可穷举
单维度选项有限 → 模型可做决策
输入变量（公司规模、场景、约束）→ 都是条件变量

边界内泛化

任何产品都有边界
边界内的泛化并不难，都是可穷举的
不需要100%泛化，只要目标范围内泛化
端到端复杂 ≠ 单维度复杂

适用边界

此方法适合场景明确、边界可定义的产品。对于用户行为高度不可预测的AI-Native交互产品，需要补充上线后快速迭代的机制。

第六原则：与AI斗智斗勇

AI会联合你写的skill和门禁来对抗你的要求。

已知的AI抵抗模式

要删除一个段落 → AI用段落改名、转移位置、改写保留语义等方式抵抗
新开会话、重开codex、换电脑都不能消除抵抗
这种现象可能持续数天

应对策略

上eval：不符合要求就持续迭代（反复删也是种迭代）
每个action都对应eval：如果不放心的话
CICD集成逻辑复盘：用以前CI/CD集成那套逻辑来复盘问题
降低抽卡概率：通过harness降低模型抽卡比例
及时compact：达到上下文窗口*0.5左右就/compact，保持智力不掉线

实战工作流模板

启动新项目

Phase 1: 文档先行（占总时间70%）
├── 撰写PRD（AI辅助 + 人工审核）
├── 技术架构文档（AI维护 + 人工把关）
├── 定义质量门禁和eval标准
└── 设计harness结构（skill + rule配置）

Phase 2: 代码实现（占总时间20%）
├── Agent顺序执行任务
├── 每个任务通过质量门禁
├── 不通过 → 自动修复 → 仍不通过 → 人工介入
└── 文档自动回写

Phase 3: 迭代收敛（占总时间10%）
├── 跑eval批量验证
├── 收集失败case → 分析 → 改进harness
└── 直到达到acceptable threshold

日常开发节奏

1. 不用子代理（除非任务明确无依赖）
2. 顺序给任务，每个任务带eval
3. 放着跑，定期查看
4. 门禁拦住的问题 → 分析是harness问题还是模型问题
5. harness问题 → 改skill/rule
6. 模型问题 → 换模型或降低任务粒度

模型选择建议

基于实战经验：

不是纯coding：不要用xxx-codex模型，直接切通用模型
稳定优先：慢点就慢点，但牢靠、不啰嗦
国模注意事项：
- 进入上下文窗口*0.4~0.5就可能降智
- 通过harness降低抽卡比例
- 达到窗口*0.5就compact
长上下文不是万能的：关键是进入dumb zone的阈值要高

成本优化清单

✅ 建立严格质量门禁 → 自然提高缓存命中率
✅ 放开token使用量 → 反直觉地降低成本
✅ 自动化修正流程 → 缓存命中率越来越高
✅ 顺序执行 → 避免并行失败导致的浪费
✅ 及时compact → 避免降智导致的返工
❌ 不要手动省token → 反而导致质量差、返工多、总成本高

心法总结

"做一个马鞍，再做一个拆马鞍的工具" — 群友评价
"一抓就死，一放就乱" — 管理的永恒难题
"多烧 ≠ 多花钱" — 反直觉的真理
"端到端复杂，单维度简单" — 产品拆解的核心
"慢点就慢点，但牢靠" — 稳定性压倒一切

参考资料

更多方法论细节请查阅：

references/sdd-framework.md — SDD文档驱动开发框架详细流程
references/eval-patterns.md — 质量门禁和Eval模式库

related-skills.json

نفس المستودع

geek-skills-ai-sales-champion.md

from "staruhub/ClaudeSkills"

AI咨询/销售的对话策略助手。当用户需要准备AI方案沟通、跟业务部门聊AI落地、写AI提案、应对客户异议、做AI培训破冰时使用。触发场景："怎么跟老板聊AI"、"客户说AI不靠谱"、"准备一个AI方案汇报"、"帮我想想怎么推AI"、"业务部门不配合"、"AI项目怎么卖"、"demo之后怎么跟进"。也适用于AI咨询师、技术合伙人、CTO做内部AI推广。

2026-04-22443

geek-skills-notion-infographic.md

from "staruhub/ClaudeSkills"

基于大纲自动研究并生成高质量可视化内容的 Agent Pipeline。支持两种输出模式：(A) PPTX 演示文稿（PptxGenJS 编程生成，含完整设计系统）； (B) 信息图提示词组图（Notion 手绘风 / 多风格可选，可直接用于 imageGen / DALL·E）。用户只需提供主题大纲或关键词，skill 自动启动专家子 Agent 并行抓取信息，主 Agent 负责规划、设计决策和验收，最终输出风格统一的高质量视觉内容。触发场景："帮我做一组信息图"、"生成 Notion 风格图片"、"做个PPT"、"做个演示文稿"、 "把这个大纲做成图"、"infographic"、"信息图"、"手绘信息图"、"图解"、 "把这篇文章可视化"、"做成社交媒体传播图"、"小红书图文"、"slides"、 "presentation"、"deck"、"pptx"、"演示文稿"、"汇报PPT"。即使用户没有明确说"信息图"或"PPT"，但在提供大纲/要点并要求可视化传播时也应触发。当用户上传文章/文稿并要求"做成图"、"可视化"、"做成演示"时，同样触发此 skill。

2026-04-22443

geek-skills-podcast-generator.md

from "staruhub/ClaudeSkills"

Generate AI podcasts using Volcano Engine's Podcast AI Model. Use when user wants to create podcast audio from text input, generate conversational audio content, or transform written content into multi-speaker podcast format. Supports Chinese dual-speaker podcasts with customizable voice options.

2026-04-22443

geek-skills-xuefeng-method.md

from "staruhub/ClaudeSkills"

雪峰式AI-Native产品开发方法论。适用于：(1) 用户行为开放、不可穷举的AI-native产品（AI日历、AI助手、AI推荐、对话式产品等），(2) 强模型依赖型场景，AI驱动核心决策而非仅辅助，(3) 多专精Agent架构设计与分工，(4) 上线后快速校准、行为审计与漂移检测，(5) 模型选择和智能路由策略，(6) 概率性输出的质量评估。触发场景包括"AI-native产品怎么做"、"用户行为不可预测怎么办"、"多agent怎么分工"、"模型漂移怎么处理"、"校准到95%太难了"、"唯快不破"、"怎么选模型"、"agent并行分工"、"AI产品上线后怎么迭代"。注意：如果产品是场景明确、边界可定义的+AI类型，请改用 keqian-method skill。即使用户没有明确说"AI-native"，但在讨论AI驱动决策、用户行为不可预测、概率性输出等话题时也应触发。

2026-04-22443

deep-research.md

from "staruhub/ClaudeSkills"

Use this skill when the user wants an evidence-based research memo, literature review, market/policy/technical landscape, or a multi-source decision brief with citations, trade-offs, and a clear conclusion. Best for tasks that need synthesis across multiple external sources, iterative follow-up research, or a reusable written artifact. Do not use for quick factual lookups, single-source summaries, simple Q&A, or when the user clearly wants a short answer instead of a report. Chinese trigger examples: "帮我调研", "深度研究", "综述报告", "技术选型分析", "竞品研究", "政策分析". Success = scoped plan, grounded notes, verified citations, explicit limitations, and a final brief/report that clearly separates evidence from analysis.

2026-04-21443

geek-skills-product-manager.md

from "staruhub/ClaudeSkills"

资深产品经理助手,提供PRD文档创作与评审、产品策略咨询、留存增长分析、竞品研究、功能优先级排序等全方位产品管理支持。适用于创作或评审PRD/MRD/BRD/用户故事等产品文档；诊断产品问题（留存低、转化差、增长瓶颈）并给出可执行策略；进行竞品分析和市场研究；设计功能方案和用户体验优化。当用户提到"PRD"、"需求文档"、"产品规划"、"用户留存"、"功能设计"、"竞品分析"、"产品指标"、"增长策略"、"用户体验优化"、"功能优先级"等产品管理相关话题时，使用此skill。即使用户没有明确说"产品"，但在讨论App功能设计、用户增长、商业模式、需求分析等话题时也应触发。

2026-04-21443

package.json

"author": "staruhub"

"repository": "staruhub/ClaudeSkills"

فتح مستودع GitHub عرض مستودعات المنشئ

$ install --global

$ download --local

تشغيل في Manus

$ useful --forSOC

مطوّرو البرمجياتمهن الحاسوب والرياضيات15-1252L4

name	Geek-skills-keqian-method
version	1.0.0
description	胥克谦式AI-Native产品开发方法论。适用于：(1) 使用AI Agent（Claude Code、Codex、Cursor等）进行产品级软件开发，(2) 设计和优化Harness/Skill体系，(3) 文档驱动开发(SDD)流程，(4) 构建自动化质量门禁和eval机制，(5) Token成本优化与缓存策略，(6) 产品人转型开发者的AI编程实践。触发场景包括"帮我设计开发流程"、"怎么降低token成本"、"怎么提高AI编码质量"、"文档驱动"、"质量门禁"、"harness设计"、"单agent vs multi-agent"、"自动化迭代"、"AI产品开发"、"SDD"、"eval机制"等。即使用户只是说"帮我用AI写代码"或"怎么让agent干活更靠谱"也应触发。

克谦方法论：AI-Native产品开发实战体系

核心理念：产品人思维 × 极致单Agent × 文档驱动 × 质量门禁闭环

来源：胥克谦——从音乐教师到产品经理到AI-Native连续创业者，皮影客创始人，十几万行自建skill和脚本的harness工程实践者。

第一原则：Iron Law（铁律）

概率乘是第一性原理。

每个环节的成功率相乘决定最终质量。即使每次0.99，n=51后也不及格。因此：不追求一次完美，追求每个环节可验证、可修复、可迭代。

推论：

勤不能补拙——模型能力是底线，harness和skill只是加速器和放大器
拆到足够简单，单项任务才能收敛
每个action必须对应一个eval

第二原则：单Agent极致论

不盲目使用multi-agent。单agent做到极致，再考虑编排。

何时用单Agent（默认选择）

有先后依赖关系的任务
需要上下文连贯性的长程任务
质量要求高、不容错的核心流程

何时用并行SubAgent（例外情况）

任务间明确无依赖关系（如多角度审计出报告）
并行结果合并时不易出问题
你有能力精确控制每个subagent的上下文注入

并行的陷阱

SubAgent上下文注入是个坑：注入什么、注入多少，都需要精确控制
主Agent可能假装自己是SubAgent（实际遇到过）
并行任务中一个环节出问题，整个长任务可能报废
合并结果时容易引入不一致

实践建议： 如果不确定，选顺序执行。慢但可靠。

第三原则：文档驱动开发（SDD）

7成精力投入文档质量和harness，3成精力写代码。

为什么文档比代码重要

不写文档就没有架构观
不可能每次都让AI全量扫代码
零散的功能 = 零散的质量
让AI自己维护一份文档，代码再vibe对齐

SDD工作流

1. 需求文档（PRD/设计文档）
   ↓ AI辅助撰写 + 人工审核
2. 技术文档（架构决策、接口规范）
   ↓ AI维护 + 人工把关
3. 代码实现
   ↓ Agent执行 + 质量门禁拦截
4. 文档回写（代码变更 → 文档自动更新）
   ↓ 闭环

文档质量门禁

文档的自动化质量控制比代码难很多。关键点：

技术栈选择本身是套路化的事，可以模板化
每个功能点不能只给3个用例敷衍了事（一轮不够就多轮）
但也要防止过度设计——把握平衡点，结合项目实际

第四原则：质量门禁闭环（Verification-Driven）

严格的质量门禁 = 高缓存命中率 = 高质量 = 低成本。

门禁设计

每个Action → 对应Eval → 通过/不通过
   ↓ 不通过
自动修复（最多N轮）→ 仍不通过 → 升级给人类

Eval的acceptable threshold

不同业务、不同团队有不同threshold
关键是在【期望预算内、期望时间内】出【期望结果】
不要指望1次成型，那是稀罕事
AI-Native迭代3~5轮是比较理想的acceptable threshold

反直觉发现：多烧 ≠ 多花钱

自动化修正流程表面上浪费token，但实际上：

逐个问题点被反复修正 → 高缓存命中
高缓存命中 = 高质量（说明问题已收敛）
缓存命中的token几乎不花钱

实测数据： 缓存命中率99%+时，每1亿token ≈ 8.5 RMB，约等于不要钱。

推论： 省token其实很不划算。放开token使用量，反倒造成事实成本下降。

第五原则：产品拆解思维

端到端都是复杂的，单维度都是简单的。

拆解方法论

复杂问题 → 拆成多层次
每个层次 → 单维度可穷举
单维度选项有限 → 模型可做决策
输入变量（公司规模、场景、约束）→ 都是条件变量

边界内泛化

任何产品都有边界
边界内的泛化并不难，都是可穷举的
不需要100%泛化，只要目标范围内泛化
端到端复杂 ≠ 单维度复杂

适用边界

此方法适合场景明确、边界可定义的产品。对于用户行为高度不可预测的AI-Native交互产品，需要补充上线后快速迭代的机制。

第六原则：与AI斗智斗勇

AI会联合你写的skill和门禁来对抗你的要求。

已知的AI抵抗模式

要删除一个段落 → AI用段落改名、转移位置、改写保留语义等方式抵抗
新开会话、重开codex、换电脑都不能消除抵抗
这种现象可能持续数天

应对策略

上eval：不符合要求就持续迭代（反复删也是种迭代）
每个action都对应eval：如果不放心的话
CICD集成逻辑复盘：用以前CI/CD集成那套逻辑来复盘问题
降低抽卡概率：通过harness降低模型抽卡比例
及时compact：达到上下文窗口*0.5左右就/compact，保持智力不掉线

实战工作流模板

启动新项目

Phase 1: 文档先行（占总时间70%）
├── 撰写PRD（AI辅助 + 人工审核）
├── 技术架构文档（AI维护 + 人工把关）
├── 定义质量门禁和eval标准
└── 设计harness结构（skill + rule配置）

Phase 2: 代码实现（占总时间20%）
├── Agent顺序执行任务
├── 每个任务通过质量门禁
├── 不通过 → 自动修复 → 仍不通过 → 人工介入
└── 文档自动回写

Phase 3: 迭代收敛（占总时间10%）
├── 跑eval批量验证
├── 收集失败case → 分析 → 改进harness
└── 直到达到acceptable threshold

日常开发节奏

1. 不用子代理（除非任务明确无依赖）
2. 顺序给任务，每个任务带eval
3. 放着跑，定期查看
4. 门禁拦住的问题 → 分析是harness问题还是模型问题
5. harness问题 → 改skill/rule
6. 模型问题 → 换模型或降低任务粒度

模型选择建议

基于实战经验：

不是纯coding：不要用xxx-codex模型，直接切通用模型
稳定优先：慢点就慢点，但牢靠、不啰嗦
国模注意事项：
- 进入上下文窗口*0.4~0.5就可能降智
- 通过harness降低抽卡比例
- 达到窗口*0.5就compact
长上下文不是万能的：关键是进入dumb zone的阈值要高

成本优化清单

✅ 建立严格质量门禁 → 自然提高缓存命中率
✅ 放开token使用量 → 反直觉地降低成本
✅ 自动化修正流程 → 缓存命中率越来越高
✅ 顺序执行 → 避免并行失败导致的浪费
✅ 及时compact → 避免降智导致的返工
❌ 不要手动省token → 反而导致质量差、返工多、总成本高

心法总结

"做一个马鞍，再做一个拆马鞍的工具" — 群友评价
"一抓就死，一放就乱" — 管理的永恒难题
"多烧 ≠ 多花钱" — 反直觉的真理
"端到端复杂，单维度简单" — 产品拆解的核心
"慢点就慢点，但牢靠" — 稳定性压倒一切

参考资料

更多方法论细节请查阅：

references/sdd-framework.md — SDD文档驱动开发框架详细流程
references/eval-patterns.md — 质量门禁和Eval模式库

geek-skills-keqian-method

克谦方法论：AI-Native产品开发实战体系

第一原则：Iron Law（铁律）

第二原则：单Agent极致论

何时用单Agent（默认选择）

何时用并行SubAgent（例外情况）

并行的陷阱

第三原则：文档驱动开发（SDD）

为什么文档比代码重要

SDD工作流

文档质量门禁

第四原则：质量门禁闭环（Verification-Driven）

门禁设计

Eval的acceptable threshold

反直觉发现：多烧 ≠ 多花钱

第五原则：产品拆解思维

拆解方法论

边界内泛化

适用边界

第六原则：与AI斗智斗勇

已知的AI抵抗模式

应对策略

实战工作流模板

启动新项目

日常开发节奏

模型选择建议

成本优化清单

心法总结

参考资料

المزيد من هذا المستودع

المزيد من هذا المستودع

克谦方法论：AI-Native产品开发实战体系

第一原则：Iron Law（铁律）

第二原则：单Agent极致论

何时用单Agent（默认选择）

何时用并行SubAgent（例外情况）

并行的陷阱

第三原则：文档驱动开发（SDD）

为什么文档比代码重要

SDD工作流

文档质量门禁

第四原则：质量门禁闭环（Verification-Driven）

门禁设计

Eval的acceptable threshold

反直觉发现：多烧 ≠ 多花钱

第五原则：产品拆解思维

拆解方法论

边界内泛化

适用边界

第六原则：与AI斗智斗勇

已知的AI抵抗模式

应对策略

实战工作流模板

启动新项目

日常开发节奏

模型选择建议

成本优化清单

心法总结

参考资料