Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

blip-2-vision-language

النجوم٩٬٩٩٦
التفرعات٧٤٥
آخر تحديث٢٥ نوفمبر ٢٠٢٥ في ٢٣:٢٨

Vision-language pre-training framework bridging frozen image encoders and LLMs. Use when you need image captioning, visual question answering, image-text retrieval, or multimodal chat with state-of-the-art zero-shot performance.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
3 ملفات
SKILL.md
readonly