with one click
with one click
[HINT] Download the complete skill directory including SKILL.md and all related files
| name | p12a-contemplation-right-effort |
| description | 停止错误方向,也是一种推进——归零分析、暂停策略、止损决策 |
| stage | planning |
| tags | ["正精进","止损","方向修正","归零分析"] |
| source_book | 观照 |
| source_chapter | 第8章 正精进 |
| version | 1.0.0 |
| 字段 | 说明 |
|---|---|
| current_effort | 当前投入的方向/项目 |
| investment_to_date | 已有投入(时间/金钱/人力) |
| original_rationale | 当初启动的理由 |
| current_signals | 当前的市场/用户反馈信号 |
定义:佛经中以琴弦譬喻修行——太紧会断,太松不成音,关键在调到合适的张力。正精进不是更拼,而是更少把力浪费在错的方向上。
书稿引用:「很多团队擅长执行精进,却缺方向精进。执行精进意味着更快交付、更密迭代、更少拖延;方向精进则意味着在开始前更认真地验证,在推进中更及时地校准,在发现不对时有勇气停下。前者很容易被表扬,后者却更容易被误解成'拖慢节奏'。」(第8章)书中进一步指出:「AI 时代会把这个问题放得更大。因为现在做东西比过去更快了,方向一旦错了,错误也会被更快、更完整地做出来。以前可能需要三个月才积累出的沉没成本,现在三周就够了。」
应用:在产品团队中区分两种精进——执行精进关注"做得更快更好",方向精进关注"做的方向是否还值得"。越是执行能力变强的时候,越需要修正努力方式,否则团队会在错误方向上显得越来越优秀。定期问自己:我们是在精进执行,还是在精进方向?
定义:在方向已经失真后,继续投入更多资源维持旧框架的行为。它与"坚持"的关键区别在于:坚持是越做越清楚"还差什么",延长偏差是越做越含糊"假设被验证会是什么样"。
书稿引用:「'还差一点就成了'——这句话在组织里太常见了。它的潜台词常常不是'方向对了,只差最后一步',而是'我们已经投了这么多,现在停下来太难看了'。很多时候,那'一点'并不是最后的工程补足,而是整个问题定义本身已经变了。」(第8章)书中以 Anthropic 招聘评估为例:当 AI 已经能超越多数候选人时,继续沿用旧测试不是"坚持",而是延长偏差——题还在出,流程还在推进,但已经不再测到真正想测的能力。
应用:判断延长偏差有三个信号——(1) 团队在过去几轮迭代里越来越难以描述"假设被验证会是什么样";(2) 继续补旧系统(改难题、限制使用)是在维持旧定义还能成立的样子;(3) 驱动继续的不再是价值判断,而是投入过多后的不甘心。识别到这些信号时,应启动归零分析。
Anthropic 的性能工程团队从 2024 年开始用一套 take-home test 招人,这套题帮团队招到了几十位工程师,原来确实有效。但到了 Claude Opus 4,在同样时间限制下 AI 已经优于多数候选人;到了 Opus 4.5,连最强候选人的区分度也快被抹平了。如果继续沿用旧流程,看上去仍然会很忙——题还在出,候选人还在做,流程还在推进——但这些动作已经越来越不再测到真正想测的能力。
current_effort: "take-home 编程测试用于招聘性能工程师"
investment_to_date: "使用超过一年,做过上千名候选人,招到几十位工程师"
original_rationale: "通过真实编程任务评估候选人的工程能力"
current_signals: "Claude Opus 4 已优于多数候选人,Opus 4.5 连最强候选人的区分度也快被抹平"
=== 归零分析报告 ===
【沉没成本隔离】
- 已投入:1年时间、1000+候选人、数十位成功招聘
- 全部标记为沉没,不影响未来决策
【归零思考】
- 如果今天第一次设计招聘流程,还会用 AI 已经能轻松超越的测试吗?
- 答案:不会 → 继续沿用旧方法是延长偏差
【信号重评】
- 趋势逆转:AI 能力持续提升,旧测试的区分度在消失
- "补旧系统"(改难题/限制AI)= 维持旧定义还能成立的样子
- 不是"不够努力",是"努力的方向需要重来"
【停止成本】
- 停止旧测试:需设计新评估方式(可接受)
- 继续旧测试:区分度持续下降,可能招到不合适的人(不可接受)
【决策】
- 选择:调整(转向)
- 从"抵抗 AI 的评估"转向"评估与 AI 协作的能力"
- 什么能力应该保留、什么已经不值得再测、什么信号才算有人类含量——这些才是真正该问的问题
【关键启发】
很多组织在这种时刻的第一反应是给旧系统打补丁,而不是重看方向。
这些动作看上去很勤奋,但只是在努力维持旧定义还能成立的样子。
一个团队投入 8 个月开发 AI 客服功能,初始假设是"AI 可以替代 80% 的人工客服"。上线 3 个月后,AI 实际只能处理 35% 的问题,且用户满意度低于人工客服。团队认为"再优化一下 prompt 和知识库就能上去",但已经花了 2 个月优化,提升缓慢。
current_effort: "AI 客服自动化功能开发和优化"
investment_to_date: "8个月开发 + 3个月上线运营,团队 5 人"
original_rationale: "AI 可以替代 80% 人工客服,大幅降低客服成本"
current_signals: "AI 处理率仅 35%,满意度低于人工,优化 2 个月提升缓慢"
=== 归零分析报告 ===
【沉没成本隔离】
- 已投入:11个月、5人团队、全部开发和运营成本
- 全部标记为沉没
【归零思考】
- 如果今天第一次看到这个数据(处理率35%、满意度低、优化2个月提升慢),会启动"替代80%"的项目吗?
- 答案:不会 → 继续追"替代 80%"是延长偏差
【信号重评】
- "替代 80%"假设已被证伪 → 趋势逆转,非暂时波动
- 优化提升缓慢 → 遇到能力天花板
- 团队在"延长偏差"状态:越做越含糊,越做越难描述"假设被验证会是什么样"
【停止成本】
- 停止"替代"方向:团队重组,已开发资产可部分复用
- 继续追"替代":持续投入,假设已证伪,回报不确定
【决策】
- 选择:调整(转向)
- 从"AI 替代人工客服"→"AI 辅助人工客服"
- 重新定义成功指标:不是"AI 处理率",而是"AI 辅助下的人工效率提升"
- 设置新检查点:3个月后评估辅助模式效果
【关键启发】
区分"坚持"和"延长偏差"的标准:
- 过去几轮迭代里越来越难描述"假设被验证会是什么样" → 延长偏差
- 能越来越精确地说出"还差哪几个信息才能判断" → 正常探索期模糊
本案属于前者。