Skip to main content
Ejecuta cualquier Skill en Manus
con un clic

blip-2-vision-language

Estrellas9996
Forks745
Actualizado25 de noviembre de 2025, 23:28

Vision-language pre-training framework bridging frozen image encoders and LLMs. Use when you need image captioning, visual question answering, image-text retrieval, or multimodal chat with state-of-the-art zero-shot performance.

Instalación

Instalar con Codex o Claude Copia este prompt, pégalo en Codex, Claude u otro asistente, y deja que revise la página de la skill y la instale por ti.

Explorador de archivos
3 archivos
SKILL.md
readonly