mit einem Klick
ab-test-analysis
// 分析 A/B 测试结果,涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据,或决定是否上线某个实验组。
// 分析 A/B 测试结果,涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据,或决定是否上线某个实验组。
对用户参与度数据执行同期群分析——留存曲线、功能采用趋势及分层洞察。适用于按同期群分析用户留存、研究功能随时间的采用情况、调查流失规律,或识别参与度趋势。
将自然语言描述转化为 SQL 查询语句。支持 BigQuery、PostgreSQL、MySQL 及其他方言。可从上传的结构图或文档中读取数据库结构。适用于编写 SQL、构建数据报表、探查数据库,或将业务问题转化为查询语句。
集思广益制定团队级 OKR(目标与关键成果),对齐公司目标——定性目标与可量化关键成果。适用于制定季度 OKR、将团队目标与公司战略对齐、起草目标,或学习如何编写有效的 OKR。
使用涵盖问题、目标、市场细分、价值主张、解决方案和发布规划的 8 节综合模板创建产品需求文档(PRD)。适用于编写 PRD、记录产品需求、准备功能规格,或评审现有 PRD。
生成用于测试的逼真虚拟数据集,支持自定义列、约束条件及输出格式(CSV、JSON、SQL、Python 脚本)。适用于创建测试数据、构建模拟数据集,或为开发和演示生成示例数据。
使用「当 [情境] 时,我想要 [动机],以便 [结果]」格式创建工作故事,附带详细的验收标准。适用于编写工作故事、创建 JTBD(用户待办任务)风格的待办事项,或表达用户情境和动机。
| name | ab-test-analysis |
| description | 分析 A/B 测试结果,涵盖统计显著性检验、样本量验证、置信区间计算及上线/延长/停止的决策建议。适用于评估实验结果、判断测试是否达到显著性、解读分流测试数据,或决定是否上线某个实验组。 |
以严格的统计方法评估 A/B 测试结果,并将发现转化为清晰的产品决策。
你正在分析 $ARGUMENTS 的 A/B 测试结果。
如果用户提供了数据文件(CSV、Excel 或数据分析平台导出文件),直接读取并分析。如有需要,生成 Python 脚本执行统计计算。
理解实验背景:
验证测试设置:
计算统计显著性:
如果用户提供了原始数据,生成并运行 Python 脚本来计算上述结果。
检查护栏指标:
解读结果:
| 结果 | 建议 |
|---|---|
| 显著正向提升,无护栏问题 | 上线 — 全量推送 |
| 显著正向提升,存在护栏顾虑 | 进一步调查 — 理解权衡后再上线 |
| 不显著,但有正向趋势 | 延长测试 — 需要更多数据或更大效应 |
| 不显著,基本持平 | 停止测试 — 未检测到有意义的差异 |
| 显著负向提升 | 不上线 — 回退到对照组,分析原因 |
提供分析摘要:
## A/B 测试结果:[测试名称]
**假设**:[我们的预期]
**时长**:[X 天] | **样本量**:[N 对照组 / M 实验组]
| 指标 | 对照组 | 实验组 | 提升 | p 值 | 是否显著? |
|---|---|---|---|---|---|
| [主要指标] | X% | Y% | +Z% | 0.0X | 是/否 |
| [护栏指标] | ... | ... | ... | ... | ... |
**建议**:[上线 / 延长 / 停止 / 进一步调查]
**理由**:[原因]
**后续行动**:[下一步]
逐步思考。保存为 Markdown 格式。如果提供了原始数据,生成 Python 脚本执行计算。