Skip to main content
Execute qualquer Skill no Manus
com um clique

blip-2-vision-language

Estrelas9.996
Forks745
Atualizado25 de novembro de 2025 às 23:28

Vision-language pre-training framework bridging frozen image encoders and LLMs. Use when you need image captioning, visual question answering, image-text retrieval, or multimodal chat with state-of-the-art zero-shot performance.

Instalação

Instalar com Codex ou Claude Copie este prompt, cole no Codex, Claude ou outro assistente e deixe que ele revise a página da skill e instale para você.

Explorador de arquivos
3 arquivos
SKILL.md
readonly