| name | minimax-understand-image |
| description | Use MiniMax MCP to analyze images, extract text (OCR), identify objects, describe visual content, and answer questions about images. Use when the user wants to understand, describe, or extract information from image files or URLs via MiniMax API. |
| compatibility | Requires uvx and MINIMAX_API_KEY environment variable |
| metadata | {"author":"minimax","version":"1.0","mcp-server":"minimax-coding-plan-mcp"} |
| allowed-tools | Bash(python3:*) Bash(uvx:*) |
MiniMax Image Understanding
通过脚本直接启动 minimax-coding-plan-mcp MCP 服务器并调用 understand_image 工具,使用 MCP stdio 协议通信。
前置条件
支持的图片格式
- JPEG / JPG、PNG、GIF、WebP
- 最大文件大小:20MB
- 支持 HTTP/HTTPS URL 或本地绝对路径
使用方法
使用脚本 scripts/understand_image.py 直接通过 stdio 调用 MCP 工具:
MINIMAX_API_KEY=your_api_key python3 scripts/understand_image.py "prompt" "image_url_or_path"
示例
python3 scripts/understand_image.py "详细描述这张图片" "https://example.com/photo.jpg"
python3 scripts/understand_image.py "提取图片中的所有文字" "/Users/me/screenshot.png"
python3 scripts/understand_image.py "这个图表展示了什么趋势?" "/tmp/chart.png"
python3 scripts/understand_image.py "找出代码中的潜在问题" "/path/to/code_screenshot.png"
python3 scripts/understand_image.py "描述界面布局并提出改进建议" "https://example.com/ui.png"
工具参数
| 参数 | 类型 | 必填 | 说明 |
|---|
prompt | string | 是 | 对图片的问题或分析需求,越具体越准确 |
image_source | string | 是 | 图片 HTTP/HTTPS URL 或本地绝对文件路径 |
工作原理
脚本会:
- 以子进程方式启动
uvx minimax-coding-plan-mcp -y
- 通过 stdio 发送 MCP JSON-RPC 协议消息(initialize → tools/call)
- 解析响应并输出图片分析结果
- 完成后终止子进程
在 Claude Code 中调用
让 Claude 通过 Bash 运行脚本:
python3 /path/to/minimax-understand-image/scripts/understand_image.py "prompt" "image_url"
确保 MINIMAX_API_KEY 已在当前 shell 环境中设置。