מפרט עיקרי במבט חטוף:
חידוש ארכיטקטוני מרכזי הוא מנגנון ה-"IndexShare". כדי להפוך את חלון ההקשר העצום של מיליון טוקנים לכלכלי, Z.ai משתמשת חוזרת באינדקסר קל-משקל אחד על פני כל ארבע שכבות של קשב דליל. על פי ניתוחים טכניים, טריק זה מפחית את החישוב לטוקן בפקטור של כ-פי 2.9 בחלון הקשר מלא של 1M, ומונע את הירידה בביצועים שלעיתים קרובות פוגעת במודלים עם הקשר ארוך .
Z.ai מיקמה את GLM-5.2 ישירות מול GPT-5.5 וקלוד אופוס 4.8. הציונים בטבלה שלהלן הם בדיווח עצמי של Z.ai, כולל הנתונים שהיא מצטטת עבור מתחריה. הם מייצגים מדידות של ספק יחיד ולא שוחזרו באופן עצמאי על ידי המעבדות המתחרות .
GLM-5.2 מוביל על GPT-5.5 במספר הערכות תכנות וחשיבה. ב-SWE-bench Pro, הוא משיג ציון של 62.1 לעומת 58.6 של GPT-5.5 . ב-FrontierSWE, מבחן תובעני בן 20 שעות להנדסה אוטונומית, הוא מציג 74.4 לעומת 72.6 של GPT-5.5
. במתמטיקה, הוא משיג ציון כמעט מושלם של 99.2 ב-AIME 2026, ועוקף את שני המתחרים האמריקאים שלו
.
הפער מקלוד אופוס 4.8 הצטמצם באופן דרמטי בתכנות סוכני. בעוד אופוס 4.8 עדיין מחזיק ביתרון ברור במספר מבחנים – בעיקר SWE-bench Pro עם 69.2 לעומת 62.1 של GLM-5.2 – התוצאות במשימות סוכניות ארוכות טווח קרובות הרבה יותר. ב-FrontierSWE, GLM-5.2 נמצא רק 0.7 נקודות מאחורי אופוס 4.8 (74.4 מול 75.1)
. ב-MCP-Atlas, הפיגור הוא 0.8 נקודות בלבד (77.0 מול 77.8)
.
הקפיצה הדורית מ-GLM-5.1 היא עצומה. השיפור הדרמטי ביותר הוא ב-Terminal-Bench 2.1, שם הציון של GLM-5.2 – 81.0 – מייצג קפיצה של 19 נקודות מהדור הקודם (62.0) . זה הופך את GLM-5.2 למודל הקוד הפתוח הראשון שחצה את רף ה-80% במבחן זה
.
חשוב לציין היכן GLM-5.2 עדיין מפגר. במשימות הקשות וארוכות הטווח ביותר, כמו SWE-Marathon (הנדסה אולטרה-ארוכה), אופוס 4.8 מוביל 26.0% לעומת 13.0% – פער משמעותי המעיד על כך שלמודלי החוד האמריקאים עדיין יש יתרון באמינות בריצות סוכניות ממושכות מאוד .
הסיפור התחרותי של GLM-5.2 נוגע למחיר בדיוק כמו לביצועים.
zai-org/GLM-5.2 תחת רישיון MIT, כולל גרסת FP8 מכוונסת לפריסה מקומית נגישה יותר שילוב זה של רישיון MIT מתירני ומודל פריסה שאינו תלוי תשתית, מאפשר למפתחים לארח את המודל בעצמם, לשלבו בצינורות CI/CD, ולהימנע מנעילת ספק – ניגוד מוחלט למודלי הגישה הסגורה וה-API בלבד של מתחריו העיקריים.
עיתוי השחרור של GLM-5.2 היה סמלי לא פחות מאשר טכני. הוא הושק באותו שבוע שבו הסלימה ממשלת ארה"ב את ההגבלות על Claude Fable 5 של Anthropic, צעד שעל פי הדיווחים הושפע משיחות בין מנכ"ל אמזון לגורמים בבית הלבן . הניגוד היה מכוון וחריף: מודל סיני חוד-קצה, פתוח לחלוטין, מגיע בדיוק בזמן שארה"ב מהדקת שליטה על מעבדה אמריקאית מובילה.
מייסד Z.ai הציג במפורש את השחרור תחת רישיון MIT עם הסלוגן, "מודיעין חוד-קצה שייך לכולם" , ומציב את GLM-5.2 הן כשחרור טכני והן כהצהרה פוליטית בתחרות הטכנולוגית המתגברת בין ארה"ב לסין.
GLM-5.2 אינו מתקיים בחלל ריק. הוא האחרון בשורה של מודלים במשקל פתוח בעלי יכולות הולכות וגדלות ממעבדות סיניות – רשימה הכוללת את DeepSeek, Qwen של עליבאבא, ו-ERNIE של באידו – שמצמצמים באופן שיטתי את פער הביצועים מול מודלים קנייניים אמריקאיים, תוך שהם מציעים גישה בלתי מוגבלת במחירים נמוכים באופן קיצוני .
Comments
0 comments