המודל השיג גם ציון 81.2 במבחן המתמטיקה AIME 2025, לעומת 65.4 עבור GPT-5.3 Instant, וציון 76 במבחן ההיגיון הרב-מודלי MMMU-Pro, לעומת 69.2 .
OpenAI שחררה גרסה חדשה של GPT-5.5 Instant שמטרתה להפוך תשובות לקצרות יותר, פחות מבוססות תבליטים ויותר שיחתיות . ראש צוות המחקר של OpenAI, מישל פוקרס, תיארה את המודל הקודם כ"מושבע מדי בתבליטים" ואמרה שהגרסה החדשה משפרת "חנפנות, עובדתיות וביצועים רב-לשוניים"
.
הערות ההשקה של OpenAI אומרות שהעדכון הופך את GPT-5.5 Instant ל"קל יותר לקריאה, טבעי יותר בשיחות יומיומיות, ומתוזמן טוב יותר במשימות סיוע מעשיות, עם פחות תגובות ארוכות מדי או עמוסות תבליטים" .
Canvas פרש הן עבור GPT-5.5 Instant והן עבור GPT-5.5 Thinking. משימות כתיבה וקוד שהשתמשו בעבר בלוח הצדדי של Canvas מופיעות כעת בלוקי כתיבה ובלוקי קוד מוטמעים בתוך שרשור הצ'אט . משתמשים בתשלום שומרים על גישה ל-Canvas דרך מודלים ישנים יותר במהלך תקופת מעבר
.
התיעוד הרשמי של OpenAI מאשר שמשתמשי Plus יכולים לשלוח מקסימום 160 הודעות GPT-5.5 בכל 3 שעות, ולאחר מכן "המערכת תעבור בשקט למודל המיני עד לאיפוס המכסה" – מדיניות שעשויה להסביר חלק מהתחושה של חוסר עקביות.
תמונת המצב מ-24 ביוני בולטת במה שחסר בה: ללא פירוט התנהגותי, ללא הערות על תכונות, וללא השוואות ביצועים. יומן השינויים הוא שורה אחת . זה עקבי עם הנוהג של OpenAI להתייחס ל-
chat-latest כיעד מתגלגל לבדיקות, אבל זה משאיר את המשתמשים והמפתחים ללא ציפיות ברורות לגבי מה השתנה.
טענות שעדכון 24 ביוני שיפר במיוחד את הבנת כוונת המשתמש, טיפול באילוצים מורכבים או המלצות קניה ומקומיות לא ניתנות לאישור ממקורות זמינים . יכולות אלה היו חלק ממערכת GPT-5.5 הרחבה יותר – ההשקה של GPT-5.5 הדגל ב-23 באפריל הדגישה "הבנה מהירה יותר של מה שאתה מנסה לעשות"
, והערות ההשקה של ChatGPT ממרץ 2026 הציגו חווית מחקר קניה אינטראקטיבית
– אך אף אחת מהן לא נקשר לתמונת המצב מ-24 ביוני.
מאז השקתו ב-5 במאי, GPT-5.5 Instant עבר שיפורים משמעותיים בדיוק העובדתי, בקיצור התשובות ובטון השיחתי. תמונת המצב מ-24 ביוני ממשיכה את דפוס העדכונים הסדירים אך חסרה תיעוד לאימות שינויים התנהגותיים ספציפיים. משתמשים החווים חוסר עקביות עלולים להיתקל במדיניות המעבר השקט למודל המיני, ולא בהרעה אמיתית במודל. עבור מפתחים המסתמכים על chat-latest בסביבת ייצור, היעדר פירוט ביומן השינויים פירושו שבדיקת כל תמונת מצב מול מקרי השימוש שלכם נותרה חיונית.
Comments
0 comments