Jeden Skill in Manus ausführen
mit einem Klick

Jeden Skill in Manus mit einem Klick ausführen

Loslegen

$pwd:

ab-test-analysis

Name: Ab Test Analysis
Author: killvxk

// 分析 A/B 测试结果，涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据，或决定是否上线某个实验组。

In Manus ausführen

$ git log --oneline --stat

stars:42

forks:6

updated:16. März 2026 um 16:18

SKILL.md

readonly

name	ab-test-analysis
description	分析 A/B 测试结果，涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据，或决定是否上线某个实验组。

A/B 测试分析

以严格的统计方法评估 A/B 测试结果，并将发现转化为清晰的产品决策。

背景

你正在分析 $ARGUMENTS 的 A/B 测试结果。

如果用户提供了数据文件（CSV、Excel 或数据分析平台导出文件），直接读取并分析。如有需要，生成 Python 脚本执行统计计算。

操作步骤

理解实验背景：
- 假设是什么？
- 改动了什么（实验组的变化）？
- 主要指标是什么？是否有护栏指标？
- 测试运行了多长时间？
- 流量分配比例是多少？
验证测试设置：
- 样本量：样本量是否足以检测预期效应量？
  - 使用公式：n = (Z²α/2 × 2 × p × (1-p)) / MDE²
  - 如果统计功效不足（< 80%），需标记
- 时长：测试是否至少运行了 1—2 个完整业务周期？
- 随机化：是否有样本比例失配（SRM）的迹象？
- 新奇效应/首因效应：时间是否足够让初期行为变化消退？
计算统计显著性：
- 对照组和实验组各自的转化率
- 相对提升：(实验组 - 对照组) / 对照组 × 100
- p 值：使用双尾 z 检验或卡方检验
- 置信区间：差值的 95% CI
- 统计显著性：p < 0.05 吗？
- 实际显著性：提升幅度对业务有意义吗？
如果用户提供了原始数据，生成并运行 Python 脚本来计算上述结果。
检查护栏指标：
- 是否有护栏指标（营收、参与度、页面加载时间）出现下降？
- 主要指标获胜但护栏指标恶化，不一定是真正的胜利

解读结果：

结果	建议
显著正向提升，无护栏问题	上线 — 全量推送
显著正向提升，存在护栏顾虑	进一步调查 — 理解权衡后再上线
不显著，但有正向趋势	延长测试 — 需要更多数据或更大效应
不显著，基本持平	停止测试 — 未检测到有意义的差异
显著负向提升	不上线 — 回退到对照组，分析原因

提供分析摘要：

## A/B 测试结果：[测试名称]

**假设**：[我们的预期]
**时长**：[X 天] | **样本量**：[N 对照组 / M 实验组]

| 指标 | 对照组 | 实验组 | 提升 | p 值 | 是否显著？ |
|---|---|---|---|---|---|
| [主要指标] | X% | Y% | +Z% | 0.0X | 是/否 |
| [护栏指标] | ... | ... | ... | ... | ... |

**建议**：[上线 / 延长 / 停止 / 进一步调查]
**理由**：[原因]
**后续行动**：[下一步]

逐步思考。保存为 Markdown 格式。如果提供了原始数据，生成 Python 脚本执行计算。

延伸阅读

related-skills.json

gleiches Repository

cohort-analysis.md

from "killvxk/pm-skills-zh"

对用户参与度数据执行同期群分析——留存曲线、功能采用趋势及分层洞察。适用于按同期群分析用户留存、研究功能随时间的采用情况、调查流失规律，或识别参与度趋势。

2026-03-1642

sql-queries.md

from "killvxk/pm-skills-zh"

将自然语言描述转化为 SQL 查询语句。支持 BigQuery、PostgreSQL、MySQL 及其他方言。可从上传的结构图或文档中读取数据库结构。适用于编写 SQL、构建数据报表、探查数据库，或将业务问题转化为查询语句。

2026-03-1642

brainstorm-okrs.md

from "killvxk/pm-skills-zh"

集思广益制定团队级 OKR（目标与关键成果），对齐公司目标——定性目标与可量化关键成果。适用于制定季度 OKR、将团队目标与公司战略对齐、起草目标，或学习如何编写有效的 OKR。

2026-03-1642

create-prd.md

from "killvxk/pm-skills-zh"

使用涵盖问题、目标、市场细分、价值主张、解决方案和发布规划的 8 节综合模板创建产品需求文档（PRD）。适用于编写 PRD、记录产品需求、准备功能规格，或评审现有 PRD。

2026-03-1642

dummy-dataset.md

from "killvxk/pm-skills-zh"

生成用于测试的逼真虚拟数据集，支持自定义列、约束条件及输出格式（CSV、JSON、SQL、Python 脚本）。适用于创建测试数据、构建模拟数据集，或为开发和演示生成示例数据。

2026-03-1642

job-stories.md

from "killvxk/pm-skills-zh"

使用「当 [情境] 时，我想要 [动机]，以便 [结果]」格式创建工作故事，附带详细的验收标准。适用于编写工作故事、创建 JTBD（用户待办任务）风格的待办事项，或表达用户情境和动机。

2026-03-1642

package.json

"author": "killvxk"

"repository": "killvxk/pm-skills-zh"

GitHub-Repository öffnen Creator-Repositorys ansehen

$ install --global

$ download --local

In Manus ausführen

$ useful --forSOC

ProjektmanagementspezialistenWirtschafts- und Finanzberufe13-1082L4

name	ab-test-analysis
description	分析 A/B 测试结果，涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据，或决定是否上线某个实验组。

A/B 测试分析

以严格的统计方法评估 A/B 测试结果，并将发现转化为清晰的产品决策。

背景

你正在分析 $ARGUMENTS 的 A/B 测试结果。

如果用户提供了数据文件（CSV、Excel 或数据分析平台导出文件），直接读取并分析。如有需要，生成 Python 脚本执行统计计算。

操作步骤

理解实验背景：
- 假设是什么？
- 改动了什么（实验组的变化）？
- 主要指标是什么？是否有护栏指标？
- 测试运行了多长时间？
- 流量分配比例是多少？
验证测试设置：
- 样本量：样本量是否足以检测预期效应量？
  - 使用公式：n = (Z²α/2 × 2 × p × (1-p)) / MDE²
  - 如果统计功效不足（< 80%），需标记
- 时长：测试是否至少运行了 1—2 个完整业务周期？
- 随机化：是否有样本比例失配（SRM）的迹象？
- 新奇效应/首因效应：时间是否足够让初期行为变化消退？
计算统计显著性：
- 对照组和实验组各自的转化率
- 相对提升：(实验组 - 对照组) / 对照组 × 100
- p 值：使用双尾 z 检验或卡方检验
- 置信区间：差值的 95% CI
- 统计显著性：p < 0.05 吗？
- 实际显著性：提升幅度对业务有意义吗？
如果用户提供了原始数据，生成并运行 Python 脚本来计算上述结果。
检查护栏指标：
- 是否有护栏指标（营收、参与度、页面加载时间）出现下降？
- 主要指标获胜但护栏指标恶化，不一定是真正的胜利

解读结果：

结果	建议
显著正向提升，无护栏问题	上线 — 全量推送
显著正向提升，存在护栏顾虑	进一步调查 — 理解权衡后再上线
不显著，但有正向趋势	延长测试 — 需要更多数据或更大效应
不显著，基本持平	停止测试 — 未检测到有意义的差异
显著负向提升	不上线 — 回退到对照组，分析原因

提供分析摘要：

## A/B 测试结果：[测试名称]

**假设**：[我们的预期]
**时长**：[X 天] | **样本量**：[N 对照组 / M 实验组]

| 指标 | 对照组 | 实验组 | 提升 | p 值 | 是否显著？ |
|---|---|---|---|---|---|
| [主要指标] | X% | Y% | +Z% | 0.0X | 是/否 |
| [护栏指标] | ... | ... | ... | ... | ... |

**建议**：[上线 / 延长 / 停止 / 进一步调查]
**理由**：[原因]
**后续行动**：[下一步]

逐步思考。保存为 Markdown 格式。如果提供了原始数据，生成 Python 脚本执行计算。

ab-test-analysis

A/B 测试分析

背景

操作步骤

延伸阅读

Mehr aus diesem Repository

Mehr aus diesem Repository

A/B 测试分析

背景

操作步骤

延伸阅读