ワンクリックで
minimax-image-understanding
// 跨平台截图分析工具,基于 MiniMax 多模态 API。支持 macOS (screencapture) 和 Windows (PowerShell) 截图,自动完成截图→Base64编码→API调用全流程。适用于:错误信息分析、代码解读、UI设计分析、文字提取、图表数据解读等场景。
// 跨平台截图分析工具,基于 MiniMax 多模态 API。支持 macOS (screencapture) 和 Windows (PowerShell) 截图,自动完成截图→Base64编码→API调用全流程。适用于:错误信息分析、代码解读、UI设计分析、文字提取、图表数据解读等场景。
可交互的智能体编排画布设计器。通过对话理解需求,启动画布展示流程, 用户可拖拽编辑,大模型读取反馈迭代。人在回路交互。 Use when 用户说"设计智能体"、"画布设计"、"编排流程"、 "workflow design"、"生成画布JSON"、"生成配置"。
You MUST use this before any creative work - creating features, building components, adding functionality, or modifying behavior. Explores user intent, requirements and design before implementation.
GitHub 仓库操作工具集,支持 Issue 评论回复、PR 创建、Issue/PR 详情查询、代码推送和 PR 创建联动。使用 Python requests 库调用 GitHub API,配合 gh CLI 工具完成分支操作。Use when 用户提到回复 GitHub Issue、创建 PR、推送并创建 PR、查看 issue 状态、GitHub 操作。
Grilling session that challenges your plan against the existing domain model, sharpens terminology, and updates documentation (CONTEXT.md, ADRs) inline as decisions crystallise. Use when user wants to stress-test a plan against their project's language and documented decisions.
Query and summarize Drifox software session history. Supports querying sessions within specified date range, auto-parsing conversation content and generating summaries. Trigger scenarios: (1) User asks to query history sessions, (2) Summarize daily conversations, (3) Analyze session records, (4) Export conversation history.
Sets up an `## Agent skills` block in AGENTS.md/CLAUDE.md and `docs/agents/` so the engineering skills know this repo's issue tracker (GitHub or local markdown), triage label vocabulary, and domain doc layout. Run before first use of `to-issues`, `to-prd`, `triage`, `diagnose`, `tdd`, `improve-codebase-architecture`, or `zoom-out` — or if those skills appear to be missing context about the issue tracker, triage labels, or domain docs.
| name | minimax-image-understanding |
| description | 跨平台截图分析工具,基于 MiniMax 多模态 API。支持 macOS (screencapture) 和 Windows (PowerShell) 截图,自动完成截图→Base64编码→API调用全流程。适用于:错误信息分析、代码解读、UI设计分析、文字提取、图表数据解读等场景。 |
支持 macOS 和 Windows 的跨平台截图分析工具。
screencapture 命令cd /Users/dingma/work/DriFox/DriFox/app/skills/minimax-image-understanding/scripts
python launcher.py
启动器会自动:
# 截图并分析
python capture_and_analyze.py
# 仅分析已有图片
python capture_and_analyze.py --no-screenshot -f myimage.png
# 自定义提示词
python capture_and_analyze.py -p "请分析这个错误信息"
# 仅截图
python take_screenshot.py screenshot.png
# 仅分析
python analyze_image.py --file screenshot.png
# macOS/Linux
export MINIMAX_API_KEY=sk-cp-xxxxxxxxxxxx
# Windows
set MINIMAX_API_KEY=sk-cp-xxxxxxxxxxxx
# 创建配置文件
mkdir -p ~/.minimax
echo "sk-cp-xxxxxxxxxxxx" > ~/.minimax/api_key
api_host = "api.minimax.chat"
endpoint = "/v1/coding_plan/vlm"
┌─────────────────────────────────────────┐
│ capture_and_analyze.py (一键入口) │
└────────────────┬────────────────────────┘
│
┌───────┴───────┐
▼ ▼
[macOS] [Windows]
screencapture PowerShell截图
│ │
└───────┬───────┘
▼
┌─────────────────────────┐
│ Base64 编码 + API 调用 │
│ prompt + image_url │
└────────────┬────────────┘
▼
┌─────────────────────────┐
│ MiniMax 视觉理解 API │
└────────────┬────────────┘
▼
返回分析结果
| 场景 | 命令 |
|---|---|
| 分析报错 | python capture_and_analyze.py -p "请分析这个截图中的错误信息" |
| 代码解读 | python capture_and_analyze.py -p "请描述截图中显示的代码内容" |
| UI分析 | python capture_and_analyze.py -p "分析这个界面的布局和设计" |
| 文字提取 | python capture_and_analyze.py -p "提取图片中的所有文字内容" |
| 图表分析 | python capture_and_analyze.py -p "描述这个图表显示的数据和趋势" |
minimax-image-understanding/
├── SKILL.md # 技能定义文件
├── scripts/
│ ├── launcher.py # 一键启动器
│ ├── capture_and_analyze.py # 一键截图+分析入口
│ ├── take_screenshot.py # 独立截图脚本
│ ├── analyze_image.py # 独立分析脚本
│ ├── requirements.txt # Python依赖(可选)
│ └── common/
│ ├── __init__.py
│ └── utils.py # 通用工具(截图、API Key、Python探测)
| 平台 | 截图方式 | 命令 |
|---|---|---|
| macOS | screencapture | screencapture -x output.png |
| Windows | PowerShell | System.Drawing.Graphics.CopyFromScreen |
payload = {
"prompt": "请详细描述这张图片的内容",
"image_url": "data:image/png;base64,<base64数据>"
}
url = "https://api.minimax.chat/v1/coding_plan/vlm"
{
"base_resp": {
"status_code": 0,
"status_msg": "success"
},
"content": "图片分析结果..."
}
| 错误 | 说明 | 解决方案 |
|---|---|---|
| 截图权限 | macOS 未授权屏幕录制 | 系统设置 → 隐私与安全性 → 屏幕录制 |
| API Key 无效 | 401/403 错误 | 检查 MINIMAX_API_KEY 是否正确 |
| 模型不支持 | 2013 错误 | 确认使用 /v1/coding_plan/vlm 端点 |
| 网络超时 | 连接失败 | 检查网络连接或增加超时时间 |
如果遇到截图权限问题:
或者使用命令授权:
tccutil reset ScreenCapture
然后重新打开应用触发权限请求。