ההבחנה המרכזית היא שבעוד שמודל Gemini 2.5 Flash Image תומך ביצירה ועריכה על בסיס פקודות טקסט ותמונות, השדרוג החדש לג'מיני לייב משלב את הלולאה היצירתית הזו לתוך שיחה קולית רציפה מול המצלמה .
מודל התמונה שמניע את החוויה הוא Gemini 2.5 Flash Image, שגוגל מכנה בחיבה "ננו-בננה". גוגל מתארת אותו כמודל יצירת ועריכת התמונות המתקדם ביותר שלה . בין היכולות המרכזיות שלו:
המודל זמין למפתחים דרך Gemini API ו-Google AI Studio, והמחיר שלו עומד על 30 דולר למיליון טוקנים בפלט, כאשר כל תמונה נחשבת כ-1,290 טוקנים .
כנס המפתחים Google I/O 2026, שהתקיים במאי 2026, היה במה מרכזית לשורה של הכרזות בינה מלאכותית שאפתניות, אשר בונות על המומנטום של ג'מיני לייב:
Gemini Omni: "ננו-בננה" לוידאו
Gemini 3.5 Flash: המודל המהיר והחכם החדש
שדרוגים נוספים:
המהלך של גוגל אינו רק שדרוג פיצ'ר בודד, אלא הצהרת כוונות על בניית צינור עיבוד רב-מודאלי ואחיד בזמן אמת. המיקום של גוגל מתבסס על עומק האינטגרציה בין כל חלקי המערכת:
היתרון התחרותי של גוגל, על סמך ההכרזות הללו, טמון ביכולתה להציע חוויה אינטואיטיבית, מהירה ומשולבת, ממצלמת הטלפון ועד לעריכת וידאו מורכבת. השאלה הגדולה שנותרה פתוחה היא כיצד יתפקדו זרימות העבודה המשולבות הללו בפועל, בקנה מידה רחב, כאשר יהפכו לזמינות לכלל המשתמשים .
Comments
0 comments