كما حقق النموذج درجة 81.2 في اختبار الرياضيات AIME 2025، ارتفاعًا من 65.4 لـ GPT-5.3 Instant، ودرجة 76 في معيار التفكير متعدد الوسائط MMMU-Pro، ارتفاعًا من 69.2 .
أصدرت OpenAI نسخة جديدة من GPT-5.5 Instant تهدف إلى جعل الإجابات أقصر، وأقل اعتمادًا على النقاط النقطية، وأكثر محادثة . وصفت ميشيل بوخراس، قائدة أبحاث OpenAI، النموذج السابق بأنه "مدمن على النقاط النقطية" (too bullet pilled) وقالت إن النسخة الجديدة تحسنت في جوانب مهمة مثل "التملق (sycophancy)، والدقة الواقعية، والأداء متعدد اللغات"
.
تقول ملاحظات إصدار OpenAI إن هذا التحديث يجعل GPT-5.5 Instant "أسهل في القراءة، وأكثر طبيعية في المحادثات اليومية، وأفضل في الإيقاع في المهام العملية المساعدة، مع ردود أقل طولاً أو كثافة في النقاط النقطية" .
تم إلغاء Canvas لكل من GPT-5.5 Instant و GPT-5.5 Thinking. مهام الكتابة والبرمجة التي كانت تستخدم سابقًا اللوحة الجانبية لـ Canvas تظهر الآن ككتل كتابة وكتل برمجة مضمنة داخل سلسلة المحادثة . يحتفظ المستخدمون المدفوعون بإمكانية الوصول إلى Canvas من خلال النماذج القديمة خلال فترة انتقالية
.
تؤكد وثائق OpenAI الرسمية أنه يمكن لمستخدمي Plus إرسال حد أقصى يبلغ 160 رسالة GPT-5.5 كل 3 ساعات، وبعد ذلك "سيقوم النظام بالتبديل بصمت إلى النموذج المصغر حتى يتم إعادة تعيين الحصة" — وهي سياسة قد تفسر بعض التناقض الملحوظ.
تبرز لقطة 24 يونيو لما تفتقر إليه: لا تفاصيل سلوكية، ولا ملاحظات حول الميزات، ولا مقارنات أداء. سجل التغييرات هو سطر واحد فقط . يتسق هذا مع ممارسة OpenAI في التعامل مع
chat-latest كهدف متداول للاختبار، لكنه يترك المستخدمين والمطورين دون توقعات واضحة للتغيير الذي حدث.
الادعاءات بأن تحديث 24 يونيو حسّن على وجه التحديد فهم نية المستخدم، أو التعامل مع القيود المعقدة، أو توصيات التسوق والمحلية لا يمكن تأكيدها من المصادر المتاحة . كانت هذه القدرات جزءًا من النظام البيئي الأوسع لـ GPT-5.5 — فقد أكد إطلاق GPT-5.5 الرئيسي في 23 أبريل على "فهم ما تحاول فعله بشكل أسرع"
، وقدمت ملاحظات إصدار ChatGPT في مارس 2026 تجربة بحث تفاعلية للتسوق
— لكن لم يتم ربط أي منهما بلقطة 24 يونيو.
منذ إطلاقه في 5 مايو، أظهر GPT-5.5 Instant تحسينات ذات معنى في الدقة الواقعية، وإيجاز الردود، ونبرة المحادثة. تواصل لقطة 24 يونيو نمط التحديثات المنتظمة لكنها تفتقر إلى التوثيق للتحقق من التغييرات السلوكية المحددة. قد يكون المستخدمون الذين يعانون من عدم الاتساق يواجهون سياسة التبديل الصامت إلى النموذج المصغر، وليس تدهور النموذج نفسه. بالنسبة للمطورين الذين يعتمدون على chat-latest في الإنتاج، فإن نقص تفاصيل سجل التغييرات يعني أن اختبار كل لقطة مقابل حالة الاستخدام الخاصة بك يظل أمرًا ضروريًا.
Comments
0 comments