| name | pm-data-analysis |
| displayName | 数据分析 |
| displayDescription | 7 合 1 数据分析技能:快照、洞察、漏斗、归因、留存、诊断、根因 |
| description | 数据分析全流程工具。当用户说'数据分析'、'metrics'、'指标'、'漏斗'、'归因'、'留存'、'cohort'、'根因分析'、'RCA'、'业务健康度'、'数据洞察'时触发。覆盖从快速概览到深度根因分析的完整光谱。 |
| user-invocable | true |
| argument-hint | [分析类型: snapshot/insight/funnel/attribution/cohort/health/rca] [指标或问题描述] |
如果作为子代理分发,停止并仅执行以下指令。
数据分析(7 合 1)
数据分析的核心不是技术,是决策。每个分析必须回答:业务决策是什么?这个数据如何改变决策?没有决策影响的分析是报告,不是分析。
Scope Gate
- IN: 指标体系设计、数据分析框架、A/B 测试统计、数据看板规划、数据产品需求
- OUT: 具体代码实现、数据库建模、ETL 管道搭建(→ pm-tech-spec 或 pm-eng-request)
保真度分级
| 保真度 | 检查范围 |
|---|
| Draft | 指标框架 + 数据源 + 分析方法选择 |
| Review(默认) | + 统计方法 + 采样方案 + 置信区间 + 交叉验证 |
| Release | + 完整统计规格 + 降级方案 + SQL/Pipeline 设计文档 |
Iron Law(铁律)
| 铁律 | 违反后果 |
|---|
| 每个数据结论必须标注来源和时效 | 立即停止——补充后继续 |
| 区分相关性与因果性 | 标注 [相关性非因果],不得暗示因果 |
| 不为让数据好看而 cherry-pick | 展示所有相关数据,包括不支持假设的 |
反合理化
| 你可能在想的 | 真相 |
|---|
| "数据说明一切" | 数据需要解读,解读有偏见 |
| "我只看关键指标" | 单一指标会误导,需要交叉验证 |
| "趋势很明显" | 明显的趋势也可能是噪声,检查统计显著性 |
| "竞品的数据也这样" | 你的问题还是你的问题,不能用别人更差来合理化 |
| "这个数据足够了" | 核心决策至少 2 个数据源支撑 |
路由:选对分析方法
根据用户问题自动匹配:
| 用户问题模式 | 推荐方法 | 产出时间 |
|---|
| "这个指标怎么样"、"帮我看看数据" | Quick Insight(快速洞察) | 5 分钟 |
| "本周/月度 metrics 概览" | Metrics Snapshot(指标快照) | 15 分钟 |
| "用户在哪里流失"、"转化率低" | Funnel Analysis(漏斗分析) | 1-2 小时 |
| "哪个渠道效果最好"、"营销 ROI" | Attribution Analysis(归因分析) | 2-3 小时 |
| "留存怎么样"、"不同用户群表现" | Cohort Analysis(留存分析) | 1-2 小时 |
| "业务健康吗"、"季度 review" | Health Diagnostic(健康诊断) | 2-3 小时 |
| "为什么突然下降/上升"、"根因" | Root Cause Analysis(根因分析) | 1-2 小时 |
Entry Mode
Guided(引导模式)— 默认
- 确认分析目的(你要回答什么业务问题?)
- 定义指标(用哪些数据衡量?)
- 选择方法(见路由表 +
references/data-analysis-framework.md)
- 输出分析框架,标注 [假设]
Quick(快速模式)— ≤ 1 个问题
直接输出分析框架 + 核心结论假设,附 [假设清单]。
Expert(专家模式)— 直接产出
多方法交叉验证,含统计检验选择理由、替代方案、敏感性分析。
分析方法决策树和统计方法速查见 references/data-analysis-framework.md。
执行流程
Step 1: 确认分析目标
问用户(Quick 模式跳过):
- 你要回答的业务问题是什么?
- 有哪些可用数据源?
- 时间范围?
- 决策影响范围(探索 / 汇报 / 战略决策)?
Step 2: 按路由方法执行
Metrics Snapshot(指标快照)
- 列出 3-5 个核心指标,含当前值、环比、趋势
- 每个指标附 2-3 句洞察(不只是"涨了/跌了")
- 标注异常值和需要关注的点
Quick Insight(快速洞察)
- TL;DR: 3 条关键发现
- 每条发现 = 数据 + 意义 + 建议行动
- 识别 1-2 个反直觉模式
- 标注数据局限
Funnel Analysis(漏斗分析)
- 定义漏斗步骤(入口 → 转化)
- 计算每步转化率和流失率
- 识别最大流失点(>30% 流失 = 红旗)
- 按渠道/设备/用户类型分拆
- 输出优化建议(Quick Wins + 长期改善)
Attribution Analysis(归因分析)
- 选择归因模型(推荐 Position-Based 平衡视角)
- 按渠道分析:触达数 / 转化数 / ROAS / CAC
- 分析典型用户路径和路径长度
- 输出预算再分配建议
Cohort Analysis(留存分析)
- 选择队列类型(时间 / 行为 / 渠道)
- 构建留存表 + 识别留存曲线形态
- 对比不同队列(新 vs 老 / 付费 vs 免费)
- 识别关键行为与留存的关联
Health Diagnostic(健康诊断)
- 5 维度评估:增长 / 盈利 / 留存 / 单位经济 / 团队
- 每维度打分(绿/黄/红)
- 识别关键风险和机会
- 按优先级输出行动计划
Root Cause Analysis(根因分析)
- 定义问题(What/Where/When/Who/Impact)
- 收集数据(定量 + 定性)
- 选择方法:5 Whys / 鱼骨图 / 变更分析
- 识别根因(非症状)
- 三层解决方案:立即修复 / 中期改善 / 长期预防
Step 3: 交叉验证
- 核心结论是否有 ≥ 2 个数据源支撑?
- 是否存在替代解释?
- 统计显著性是否足够(样本量、时间跨度)?
Step 4: 输出建议
按优先级分类:
- 立即行动(本周)— 高影响 + 低成本
- 短期改善(本月)— 需要一定资源
- 长期投资(本季度)— 战略级改善
详细检查清单和约束见 references/delivery-checklist.md、references/hard-bans.md 和 references/source-attribution.md
输出规范
直接输出 Markdown(不包裹在代码块中)。核心产出:
- 关键发现(3-5 条,每条含数据 + 洞察 + 行动)
- 数据表(指标 × 时间/维度)
- 建议(按优先级排序)
- 数据局限(诚实标注不确定性)
后续推荐
- 数据指向产品问题 → pm-prd 或 pm-experiment
- 需要更深层用户洞察 → pm-persona
- 指标定义不清 → pm-metrics
- 结果需要汇报 → pm-solution-brief