אם תמונות יכלו לדבר

ממש בתחילת 2023 סיילספורס חשפו את הדור החדש של בליפ, מודל הטקסט מתמונה שהציגו לראשונה בתחילת 2022. מעבר ליכולות משודרגות - כולל יכולת לנהל שיחה שלמה עם המודל על מה שמופיע בתוך התמונה - סיילספורס שמו דגש הפעם על פיתוח המודל תוך שימוש במודלי שפה מבוססי קוד-פתוח הזמינים לכל אדם בעל גישה לרשת. כל מה שהם עשו כביכול, הוא רק לחבר את המודלים ביחד בעזרת טרנספורמר. אבל ברור שיש כאן יותר מזה.
לינק לדמו של בליפ-2 בהאגינג-פייס

⇤ חזור

אם תמונות יכלו לדבר

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models