האפליקציה זמינה כעת ב-macOS, iOS ו-Android, אך גרסת ה-Mac מבליטה אסטרטגיית אוצרות ייחודית . בניגוד לספריות הפתוחות של Ollama ו-LM Studio, שמאפשרות למשוך כמעט כל מודל תואם, גרסת ה-Mac של AI Edge Gallery חושפת כרגע חמישה מודלי Gemma שאוצרו בקפידה על ידי גוגל
. על פי דיווח של 9to5Mac, המודלים הזמינים כוללים את Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, גרסת Gemma-4 26B, ואת FunctionGemma-270M
. מבחר מצומצם זה הוא לב ליבה של האסטרטגיה: סביבה מבוקרת בעלת איכות מובטחת
.
מתחת למכסה המנוע, המערכת כולה מונעת על ידי מנוע ההסקה LiteRT-LM של גוגל. המנוע תומך במעבדים גרפיים (GPU), מעבדים מרכזיים (CPU) ומעבדים עצביים (NPU) על פני Linux, macOS ו-Windows . המודל המוביל להדגמת ביצועים הוא Gemma-4-E2B (בנפח 2.58 ג'יגה-בייט), והתיעוד הרשמי מספק הצצה ברורה ליכולותיו על MacBook Pro M4
:
הזינוק העצום במהירות עם האצה גרפית מדגיש עד כמה המקבץ של גוגל מכוון היטב ל-API הגרפי Metal של Apple Silicon, ומספק חוויית משתמש כמעט מיידית וחלקה.
מודל Gemma 4 12B, ששוחרר תחת רישיון Apache 2.0, הוא כוכב ההשקה הזו . הארכיטקטורה שלו היא המבדלת הגדולה ביותר. מדובר בטרנספורמר צפוף, מסוג decoder-only, המשתמש באותו מבנה מפענח מתקדם כמו המודל הגדול והצפוף Gemma 4 31B
.
החידוש הקריטי הוא העיצוב הרב-מודאלי נטול המקודדים. רוב המודלים הרב-מודאליים משתמשים במקודדים נפרדים ומסורבלים לראייה (כמו ViT) ולשמע (כמו שכבות conformer) כדי לתרגם מידע עבור מודל השפה . Gemma 4 12B מבטל אותם לחלוטין
. במקומם, הוא משתמש ב:
דבר זה מאפשר למודל לעבד באופן טבעי טקסט, תמונות, שמע ווידאו בתזרים אחיד אחד . גוגל טוענת שארכיטקטורה זו מספקת "ביצועים המתקרבים למודל 26B MoE שלנו עם פחות ממחצית הזיכרון," והכל תוך כדי ריצה על מחשבים ניידים עם 16 ג'יגה-בייט של זיכרון מאוחד בלבד
.
ציוני הביצועים מאששים את הביטחון הזה, ומראים שמודל ה-12B מתעלה בהרבה על קטגוריית המשקל שלו. במבחן GPQA Diamond (הסקה ברמת תואר שני), הוא משיג ציון מרשים של 78.8, קרוב לגרסת ה-26B. במבחני בחירה מרובה בסגנון אקדמי כמו MMLU Pro, הוא מגיע ל-77.2%, ובמבחן המתמטיקה התחרותי AIME 2026 הוא קולע 77.5% . במדד LiveCodeBench ליצירת קוד, הוא מגיע לציון של 72.5%, מה שמדגים יכולות מעשיות וחזקות בתהליכי עבודה אוטונומיים והסקה רב-שלבית
.
את שלישיית המוצרים משלימה אפליקציית Google AI Edge Eloquent, אפליקציית הכתבה שממצבת את עצמה כאלטרנטיבה חינמית וישירה לשירותי תמלול בתשלום . האפליקציה מונעת על ידי מודלים מבוססי Gemma ותוכננה להיות לא מקוונת לחלוטין (offline-first)
.
היא מתעלה על תמלול פשוט בכך שהיא מתפקדת כמשפצת דיבור אוטומטית. היא "גוזרת באגרסיביות" מילות מילוי כמו "אמ" ו"אה", מתקנת דקדוק תוך כדי תנועה, ומבנתת מחדש דיבור גולמי וכאוטי לטקסט קוהרנטי ומקצועי . זה הופך אותה ליותר כלי תקשורת מאשר אפליקציית רישום הערות. המבדל העיקרי הוא תג המחיר: אין מנוי ואין הגבלת שימוש
. גרסת ה-Mac דורשת macOS 13.0 ומעלה ושבב Apple M1 ומעלה, אם כי דף ה-App Store מציין שכמה תכונות מתקדמות ואופציונליות עשויות לדרוש עיבוד ענן
.
השקה זו מבססת שתי פילוסופיות מנוגדות ל-AI מקומי. האסטרטגיה של גוגל היא גישת "גן סגור": אוסף אוצר ומאושר של מודלים, המשולבים היטב עם אפליקציות ממותגות וצד-ראשון (Gallery לחקר, Eloquent להכתבה), ומנוע הסקה אחיד (LiteRT-LM) עם ממשק שורת פקודה ו-API לפייתון . המטרה היא לספק חוויית צרכן חלקה ש"פשוט עובדת" מיד עם הוצאתה מהקופסה.
זאת בניגוד ישיר ל-Ollama ו-LM Studio, שנותנים עדיפות לגמישות ובחירה מקסימלית כספריות פתוחות שבהן משתמשים יכולים למשוך כל מודל תואם . חשוב לציין שגם Ollama וגם LM Studio כבר תומכים במודל Gemma 4 12B בעל המשקלים הפתוחים, כך שהמודל של גוגל אינו בלעדי למקבץ שלה
.
היתרון של גוגל טמון באופטימיזציה ייחודית של צד ראשון, כאשר המודלים שלה מכוונים במיוחד עבור מנוע ההסקה שלה על Apple Silicon, כדי לספק ביצועים טובים יותר וצריכת זיכרון נמוכה יותר. הפשרה עבור המשתמש ברורה: אתה מקבל חוויה מלוטשת ומשולבת יותר, אך אינך יכול להריץ מודלים מחוץ למשפחת Gemma האוצרת של גוגל. זה ממקם את גוגל בעמדה ללכוד משתמשים שמעריכים אמינות וקלות שימוש על פני חופש ניסוי, ויוצר פיצול ברור בדרך לעולם ה-AI המקומי ב-Mac.
Comments
0 comments