一键在 Manus 中运行任何 Skill

machine-learning

Machine learning development patterns, model training, evaluation, and deployment. Use when building ML pipelines, training models, feature engineering, model evaluation, or deploying ML systems to production.

在 Manus 中运行

星标360

分支29

更新时间2026年1月20日 01:00

来源

aiskillstore

aiskillstore/marketplace

打开 GitHub 仓库查看创作者相关仓库

安装命令

下载

在 Manus 中运行

适用职业SOC

数据科学家计算机与数学类职业15-2051L4

文件资源管理器

3 个文件

SKILL.md

readonly

name	machine-learning
description	Machine learning development patterns, model training, evaluation, and deployment. Use when building ML pipelines, training models, feature engineering, model evaluation, or deploying ML systems to production.
author	Joseph OBrien
status	unpublished
updated	2025-12-23
version	1.0.1
tag	skill
type	skill

Machine Learning

Comprehensive machine learning skill covering the full ML lifecycle from experimentation to production deployment.

When to Use This Skill

Building machine learning pipelines
Feature engineering and data preprocessing
Model training, evaluation, and selection
Hyperparameter tuning and optimization
Model deployment and serving
ML experiment tracking and versioning
Production ML monitoring and maintenance

ML Development Lifecycle

1. Problem Definition

Classification Types:

Binary classification (spam/not spam)
Multi-class classification (image categories)
Multi-label classification (document tags)
Regression (price prediction)
Clustering (customer segmentation)
Ranking (search results)
Anomaly detection (fraud detection)

Success Metrics by Problem Type:

Problem Type	Primary Metrics	Secondary Metrics
Binary Classification	AUC-ROC, F1	Precision, Recall, PR-AUC
Multi-class	Macro F1, Accuracy	Per-class metrics
Regression	RMSE, MAE	R², MAPE
Ranking	NDCG, MAP	MRR
Clustering	Silhouette, Calinski-Harabasz	Davies-Bouldin

2. Data Preparation

Data Quality Checks:

Missing value analysis and imputation strategies
Outlier detection and handling
Data type validation
Distribution analysis
Target leakage detection

Feature Engineering Patterns:

Numerical: scaling, binning, log transforms, polynomial features
Categorical: one-hot, target encoding, frequency encoding, embeddings
Temporal: lag features, rolling statistics, cyclical encoding
Text: TF-IDF, word embeddings, transformer embeddings
Geospatial: distance features, clustering, grid encoding

Train/Test Split Strategies:

Random split (standard)
Stratified split (imbalanced classes)
Time-based split (temporal data)
Group split (prevent data leakage)
K-fold cross-validation

3. Model Selection

Algorithm Selection Guide:

Data Size	Problem	Recommended Models
Small (<10K)	Classification	Logistic Regression, SVM, Random Forest
Small (<10K)	Regression	Linear Regression, Ridge, SVR
Medium (10K-1M)	Classification	XGBoost, LightGBM, Neural Networks
Medium (10K-1M)	Regression	XGBoost, LightGBM, Neural Networks
Large (>1M)	Any	Deep Learning, Distributed training
Tabular	Any	Gradient Boosting (XGBoost, LightGBM, CatBoost)
Images	Classification	CNN, ResNet, EfficientNet, Vision Transformers
Text	NLP	Transformers (BERT, RoBERTa, GPT)
Sequential	Time Series	LSTM, Transformer, Prophet

4. Model Training

Hyperparameter Tuning:

Grid Search: exhaustive, good for small spaces
Random Search: efficient, good for large spaces
Bayesian Optimization: smart exploration (Optuna, Hyperopt)
Early stopping: prevent overfitting

Common Hyperparameters:

Model	Key Parameters
XGBoost	learning_rate, max_depth, n_estimators, subsample
LightGBM	num_leaves, learning_rate, n_estimators, feature_fraction
Random Forest	n_estimators, max_depth, min_samples_split
Neural Networks	learning_rate, batch_size, layers, dropout

5. Model Evaluation

Evaluation Best Practices:

Always use held-out test set for final evaluation
Use cross-validation during development
Check for overfitting (train vs validation gap)
Evaluate on multiple metrics
Analyze errors qualitatively

Handling Imbalanced Data:

Resampling: SMOTE, undersampling
Class weights: weighted loss functions
Threshold tuning: optimize decision threshold
Evaluation: use PR-AUC over ROC-AUC

6. Production Deployment

Model Serving Patterns:

REST API (Flask, FastAPI, TF Serving)
Batch inference (scheduled jobs)
Streaming (real-time predictions)
Edge deployment (mobile, IoT)

Production Considerations:

Latency requirements (p50, p95, p99)
Throughput (requests per second)
Model size and memory footprint
Fallback strategies
A/B testing framework

7. Monitoring & Maintenance

What to Monitor:

Prediction latency
Input feature distributions (data drift)
Prediction distributions (concept drift)
Model performance metrics
Error rates and types

Retraining Triggers:

Performance degradation below threshold
Significant data drift detected
Scheduled retraining (daily, weekly)
New training data available

MLOps Best Practices

Experiment Tracking

Track for every experiment:

Code version (git commit)
Data version (hash or version ID)
Hyperparameters
Metrics (train, validation, test)
Model artifacts
Environment (packages, versions)

Model Versioning

models/
├── model_v1.0.0/
│   ├── model.pkl
│   ├── metadata.json
│   ├── requirements.txt
│   └── metrics.json
├── model_v1.1.0/
└── model_v2.0.0/

CI/CD for ML

Continuous Integration:
- Data validation tests
- Model training tests
- Performance regression tests
Continuous Deployment:
- Staging environment validation
- Shadow mode testing
- Gradual rollout (canary)
- Automatic rollback

Reference Files

For detailed patterns and code examples, load reference files as needed:

references/preprocessing.md - Data preprocessing patterns and feature engineering techniques
references/model_patterns.md - Model architecture patterns and implementation examples
references/evaluation.md - Comprehensive evaluation strategies and metrics

Integration with Other Skills

performance - For optimizing inference latency
testing - For ML-specific testing patterns
database-optimization - For feature store queries
debugging - For model debugging and error analysis

同仓库更多 Skills

同仓库

yescan-transoffice-universal

aiskillstore/marketplace

当用户需要将图片、截图或扫描件转换为 Office 文档（Word/Excel）或 PDF 时，使用此技能。适用于包含复杂表格、合同或图文混排内容的图片或扫描件，可尽量还原原始版式并生成可编辑文档。本技能由夸克扫描王提供转换支持。即使用户未明确提到格式转换，只要用户的需求涉及将图片内容转换为可编辑文档（如 .docx、.xlsx 或 .pdf），也应触发此技能。请勿用于提取纯文本或识别文字内容、图像增强处理或从零创建文档

2026-06-16360

yescan-ocr-universal

aiskillstore/marketplace

当用户需要从图片、截图、照片或扫描文档中提取、识别或结构化文本，就使用此技能——包括手写体、表格、数学公式、商品图、各类证件（身份证、社保卡、驾照、行驶证、港澳台通行证、学位证等）、票据（增值税发票、火车票、英文发票等）、医疗报告、营业执照以及习题。本技能由夸克扫描王提供支持。即使用户没有明确提到“OCR”或“文字识别”，只要用户的需求涉及从图片中获取文字或关键信息，也应触发此技能。不适用于图像生成、图像编辑或无需从图片中提取文本的任务

2026-06-15360

daedalus-skill

aiskillstore/marketplace

对话式产品孵化技能。帮助零基础用户将模糊想法转化为结构化产品需求文档（PRD），包含门槛评估、风险提示、竞品对照、边界定义和工具链推荐。

2026-06-14360

prism-skill

aiskillstore/marketplace

棱镜 - 多学科动态适配分析引擎。支持真实性核查、片段补全、结构化输出（表格/流程图/列表）、HTML/Markdown导出，柔和化交互，多语言自适应。

2026-06-14360

zach-feature-demand-validator

aiskillstore/marketplace

功能需求真伪验证器。用三维数据（Review/关键词/社区）验证微创新是否真实需求。使用时机：品类选定后评估微创新、竞品分析发现差异点后判断要不要跟进。触发词：/zach-feature-demand-validator

2026-06-12360

obsidian-theme-designer

aiskillstore/marketplace

Use when the user wants to design, preview, or customize an Obsidian vault theme — including choosing styles, comparing color schemes, adjusting typography, or generating CSS snippets. Triggers on keywords like "Obsidian theme", "color scheme", "CSS snippet", "appearance".

2026-06-10360

name	machine-learning
description	Machine learning development patterns, model training, evaluation, and deployment. Use when building ML pipelines, training models, feature engineering, model evaluation, or deploying ML systems to production.
author	Joseph OBrien
status	unpublished
updated	2025-12-23
version	1.0.1
tag	skill
type	skill

Machine Learning

Comprehensive machine learning skill covering the full ML lifecycle from experimentation to production deployment.

When to Use This Skill

Building machine learning pipelines
Feature engineering and data preprocessing
Model training, evaluation, and selection
Hyperparameter tuning and optimization
Model deployment and serving
ML experiment tracking and versioning
Production ML monitoring and maintenance

ML Development Lifecycle

1. Problem Definition

Classification Types:

Binary classification (spam/not spam)
Multi-class classification (image categories)
Multi-label classification (document tags)
Regression (price prediction)
Clustering (customer segmentation)
Ranking (search results)
Anomaly detection (fraud detection)

Success Metrics by Problem Type:

Problem Type	Primary Metrics	Secondary Metrics
Binary Classification	AUC-ROC, F1	Precision, Recall, PR-AUC
Multi-class	Macro F1, Accuracy	Per-class metrics
Regression	RMSE, MAE	R², MAPE
Ranking	NDCG, MAP	MRR
Clustering	Silhouette, Calinski-Harabasz	Davies-Bouldin

2. Data Preparation

Data Quality Checks:

Missing value analysis and imputation strategies
Outlier detection and handling
Data type validation
Distribution analysis
Target leakage detection

Feature Engineering Patterns:

Numerical: scaling, binning, log transforms, polynomial features
Categorical: one-hot, target encoding, frequency encoding, embeddings
Temporal: lag features, rolling statistics, cyclical encoding
Text: TF-IDF, word embeddings, transformer embeddings
Geospatial: distance features, clustering, grid encoding

Train/Test Split Strategies:

Random split (standard)
Stratified split (imbalanced classes)
Time-based split (temporal data)
Group split (prevent data leakage)
K-fold cross-validation

3. Model Selection

Algorithm Selection Guide:

Data Size	Problem	Recommended Models
Small (<10K)	Classification	Logistic Regression, SVM, Random Forest
Small (<10K)	Regression	Linear Regression, Ridge, SVR
Medium (10K-1M)	Classification	XGBoost, LightGBM, Neural Networks
Medium (10K-1M)	Regression	XGBoost, LightGBM, Neural Networks
Large (>1M)	Any	Deep Learning, Distributed training
Tabular	Any	Gradient Boosting (XGBoost, LightGBM, CatBoost)
Images	Classification	CNN, ResNet, EfficientNet, Vision Transformers
Text	NLP	Transformers (BERT, RoBERTa, GPT)
Sequential	Time Series	LSTM, Transformer, Prophet

4. Model Training

Hyperparameter Tuning:

Grid Search: exhaustive, good for small spaces
Random Search: efficient, good for large spaces
Bayesian Optimization: smart exploration (Optuna, Hyperopt)
Early stopping: prevent overfitting

Common Hyperparameters:

Model	Key Parameters
XGBoost	learning_rate, max_depth, n_estimators, subsample
LightGBM	num_leaves, learning_rate, n_estimators, feature_fraction
Random Forest	n_estimators, max_depth, min_samples_split
Neural Networks	learning_rate, batch_size, layers, dropout

5. Model Evaluation

Evaluation Best Practices:

Always use held-out test set for final evaluation
Use cross-validation during development
Check for overfitting (train vs validation gap)
Evaluate on multiple metrics
Analyze errors qualitatively

Handling Imbalanced Data:

Resampling: SMOTE, undersampling
Class weights: weighted loss functions
Threshold tuning: optimize decision threshold
Evaluation: use PR-AUC over ROC-AUC

6. Production Deployment

Model Serving Patterns:

REST API (Flask, FastAPI, TF Serving)
Batch inference (scheduled jobs)
Streaming (real-time predictions)
Edge deployment (mobile, IoT)

Production Considerations:

Latency requirements (p50, p95, p99)
Throughput (requests per second)
Model size and memory footprint
Fallback strategies
A/B testing framework

7. Monitoring & Maintenance

What to Monitor:

Prediction latency
Input feature distributions (data drift)
Prediction distributions (concept drift)
Model performance metrics
Error rates and types

Retraining Triggers:

Performance degradation below threshold
Significant data drift detected
Scheduled retraining (daily, weekly)
New training data available

MLOps Best Practices

Experiment Tracking

Track for every experiment:

Code version (git commit)
Data version (hash or version ID)
Hyperparameters
Metrics (train, validation, test)
Model artifacts
Environment (packages, versions)

Model Versioning

models/
├── model_v1.0.0/
│   ├── model.pkl
│   ├── metadata.json
│   ├── requirements.txt
│   └── metrics.json
├── model_v1.1.0/
└── model_v2.0.0/

CI/CD for ML

Continuous Integration:
- Data validation tests
- Model training tests
- Performance regression tests
Continuous Deployment:
- Staging environment validation
- Shadow mode testing
- Gradual rollout (canary)
- Automatic rollback

Reference Files

For detailed patterns and code examples, load reference files as needed:

references/preprocessing.md - Data preprocessing patterns and feature engineering techniques
references/model_patterns.md - Model architecture patterns and implementation examples
references/evaluation.md - Comprehensive evaluation strategies and metrics

Integration with Other Skills

performance - For optimizing inference latency
testing - For ML-specific testing patterns
database-optimization - For feature store queries
debugging - For model debugging and error analysis