Skip to main content
在 Manus 中运行任何 Skill
一键导入
$pwd:

ck-ai-multimodal

// Analyze images/audio/video with Gemini API (better vision than Claude). Generate images (Imagen 4, Nano Banana 2, MiniMax), videos (Veo 3, Hailuo), speech (MiniMax TTS), music (MiniMax). Use for vision analysis, transcription, OCR, design extraction, multimodal AI.

$ git log --oneline --stat
stars:1,141
forks:378
updated:2026年5月9日 17:04
文件资源管理器
26 个文件
SKILL.md
readonly