Skip to main content
Manusで任意のスキルを実行
ワンクリックで
$pwd:

ck-ai-multimodal

// Analyze images/audio/video with Gemini API (better vision than Claude). Generate images (Imagen 4, Nano Banana 2, MiniMax), videos (Veo 3, Hailuo), speech (MiniMax TTS), music (MiniMax). Use for vision analysis, transcription, OCR, design extraction, multimodal AI.

$ git log --oneline --stat
stars:1,141
forks:378
updated:2026年5月9日 17:04
ファイルエクスプローラー
26 ファイル
SKILL.md
readonly