ワンクリックで
ワンクリックで
全面的AB测试分析工具,支持实验设计、统计检验、用户分群分析和可视化报告生成。用于分析产品改版、营销活动、功能优化等AB测试结果,提供统计显著性检验和深度洞察。
Perform multi-touch attribution analysis using Markov chains, Shapley values, and custom attribution models. Use when you need to analyze marketing channel effectiveness, calculate conversion attribution, optimize marketing budgets, or understand customer journey paths. Supports channel transition analysis, ROI calculation, and marketing optimization insights with Chinese language support.
Generates production-ready analysis code in Python, R, SQL. Invoke when user wants reusable code for data analysis, ML, or visualization.
Analyze text content using both traditional NLP and LLM-enhanced methods. Extract sentiment, topics, keywords, and insights from various content types including social media posts, articles, reviews, and video content. Use when working with text analysis, sentiment detection, topic modeling, or content optimization.
自动化数据探索和可视化工具,提供从数据加载到专业报告生成的完整EDA解决方案。支持多种图表类型、智能数据诊断、建模评估和HTML报告生成。适用于医疗、金融、电商等领域的数据分析项目。
Performs exploratory data analysis, statistical analysis, and pattern discovery. Invoke when user wants to analyze data, find patterns, statistical testing, or get deep insights.
| name | data-analysis |
| description | 通用的 6 阶段数据分析助手:数据质量→探索性分析→假设生成→可视化→代码生成→综合报告。提供完整的方法论和模板! |
此 skill 提供专业的数据分析方法论,采用标准的 6 阶段工作流,适用于任何数据集。
┌─────────────────────────────────────────────────────────────┐
│ Stage 1: 数据质量检查 (Data Quality) │
│ - 完整性、唯一性、有效性检查 │
│ - 问题诊断和改进建议 │
└─────────────────────────┬───────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Stage 2: 探索性数据分析 (Exploratory Data Analysis) │
│ - 描述性统计(均值、中位数、标准差) │
│ - 相关性分析、模式发现 │
│ - 异常检测 │
└─────────────────────────┬───────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Stage 3: 研究假设生成 (Hypothesis Generation) │
│ - 基于数据发现生成可检验假设 │
│ - A/B 测试设计、实验方法论 │
└─────────────────────────┬───────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Stage 4: 数据可视化 (Visualization) │
│ - 统计图表、分布图、热力图 │
│ - 交互式仪表板 │
└─────────────────────────┬───────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Stage 5: 可复用代码生成 (Code Generation) │
│ - 数据处理管道、分析函数库 │
│ - 机器学习代码(如需要) │
└─────────────────────────┬───────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────┐
│ Stage 6: 综合报告生成 (Report Generation) │
│ - 综合分析报告 + 执行摘要 │
│ - 业务洞察和建议 │
└─────────────────────────────────────────────────────────────┘
.trae/skills/data-analysis/
├── SKILL.md # 本文档
├── templates/ # 📋 模板目录
│ ├── stage1_quality_template.md # Stage 1: 数据质量报告模板
│ ├── stage2_eda_template.md # Stage 2: 探索性分析报告模板
│ ├── stage3_hypothesis_template.md # Stage 3: 假设生成模板
│ ├── stage4_visualization_template.md # Stage 4: 可视化模板
│ ├── stage5_code_template.md # Stage 5: 代码生成模板
│ └── stage6_report_template.md # Stage 6: 综合报告模板
├── examples/ # 📊 示例目录
│ └── olist/ # Olist 数据集分析示例(仅供参考)
│ ├── README.md
│ └── sample_outputs/
└── guide/ # 📖 详细指南
├── stage1_quality_guide.md
├── stage2_eda_guide.md
├── stage3_hypothesis_guide.md
├── stage4_visualization_guide.md
├── stage5_code_guide.md
└── stage6_report_guide.md
当用户需要分析数据时,按照以下 6 个阶段进行:
1. Stage 1: 数据质量检查
2. Stage 2: 探索性数据分析
3. Stage 3: 研究假设生成
4. Stage 4: 数据可视化
5. Stage 5: 代码生成(如需要)
6. Stage 6: 综合报告生成
创建以下输出目录结构(可自定义名称):
analysis_results/
├── stage1_quality_report/
├── stage2_eda_report/
├── stage3_hypothesis_report/
├── stage4_visualizations/
├── stage5_generated_code/
└── stage6_final_report/
目标: 评估数据质量,识别问题并提出改进建议
检查要点:
输出:
参考模板: templates/stage1_quality_template.md
目标: 理解数据结构,发现模式和洞察
分析内容:
输出:
参考模板: templates/stage2_eda_template.md
目标: 基于数据发现生成可检验的假设
假设类型:
输出:
参考模板: templates/stage3_hypothesis_template.md
目标: 用图表讲述数据故事
图表类型:
输出:
参考模板: templates/stage4_visualization_template.md
目标: 生成可复用的分析代码
代码类型:
输出:
参考模板: templates/stage5_code_template.md
目标: 汇总所有分析,提供业务洞察
报告结构:
输出:
参考模板: templates/stage6_report_template.md
| 分析类型 | 方法 |
|---|---|
| 描述统计 | 均值、中位数、标准差、分位数 |
| 相关性 | Pearson/Spearman 相关系数 |
| 假设检验 | t 检验、ANOVA、卡方检验 |
| 异常检测 | IQR、Z-score、DBSCAN |
| 客户分群 | RFM 分析、K-means 聚类 |
| 预测模型 | 线性回归、随机森林、XGBoost |
所有分析输出、报告和可视化使用中文,除非用户另有说明。
每个阶段的详细操作指南,请参考 guide/ 目录下的文档。
✅ 通用化: 适用于任何数据集,不绑定特定数据
✅ 指导性: 提供方法论和模板,而非写死的脚本
✅ 完整: 标准 6 阶段工作流
✅ 本地化: 所有内容放在 skill 目录下
✅ 可扩展: 可根据需要添加新模板和指南