Модель также показала результат 81.2 балла на математическом тесте AIME 2025 (против 65.4 у GPT-5.3 Instant) и 76 баллов в тесте на мультимодальное рассуждение MMMU-Pro (против 69.2) .
OpenAI выпустила новую версию GPT-5.5 Instant, нацеленную на то, чтобы сделать ответы более короткими, менее маркированными и более разговорными . Мишель Покрас, руководитель исследовательского отдела OpenAI, охарактеризовала предыдущую модель как «слишком помешанную на маркированных списках» и заявила, что новая версия добилась улучшений в таких важных аспектах, как «подхалимство, фактологическая точность и многоязычная производительность»
.
В примечаниях к релизу OpenAI говорится, что это обновление делает GPT-5.5 Instant «более лёгкой для чтения, более естественной в повседневном общении и лучше подходящей для практических задач, с меньшим количеством излишне длинных или перегруженных маркированными списками ответов» .
Интерфейс Canvas был удалён как для GPT-5.5 Instant, так и для GPT-5.5 Thinking. Задачи по написанию текстов и коду, которые раньше решались с помощью боковой панели Canvas, теперь отображаются в виде встроенных блоков для текста и кода непосредственно в ветке чата . Платные пользователи сохраняют доступ к Canvas через устаревшие модели в течение переходного периода
.
Собственная документация OpenAI подтверждает, что пользователи Plus могут отправлять максимум 160 сообщений GPT-5.5 каждые 3 часа, после чего «система незаметно переключится на мини-модель до сброса квоты» — эта политика может объяснять некоторую наблюдаемую непоследовательность.
Июньский снимок выделяется именно тем, чего в нём нет: никаких деталей о поведении, никаких заметок о функциях и никаких сравнительных показателей производительности. Журнал изменений состоит из одной строки . Это согласуется с практикой OpenAI рассматривать
chat-latest как «катящуюся» цель для тестирования, но это оставляет пользователей и разработчиков без чётких ожиданий того, что именно изменилось.
Утверждения о том, что обновление от 24 июня специально улучшило понимание намерений пользователя, обработку сложных ограничений или рекомендации по покупкам и локальному поиску, не могут быть подтверждены из доступных источников . Эти возможности были частью более широкой экосистемы GPT-5.5 — запуск флагманской модели GPT-5.5 23 апреля подчеркивал «способность быстрее понимать, что вы пытаетесь сделать»
, а примечания к выпуску ChatGPT за март 2026 года представили интерактивный опыт исследования покупок
— но ни одно из этих изменений не было привязано к июньскому снимку.
С момента своего запуска 5 мая GPT-5.5 Instant претерпела значимые улучшения в фактологической точности, краткости ответов и разговорном тоне. Июньский снимок продолжает практику регулярных обновлений, но не имеет документации, которая позволила бы проверить конкретные поведенческие изменения. Пользователи, испытывающие непоследовательность, возможно, сталкиваются с политикой незаметного переключения на мини-модель, а не с ухудшением самой модели. Для разработчиков, использующих chat-latest в продакшене, отсутствие деталей в журнале изменений означает, что тестирование каждого снимка под свой сценарий использования остаётся обязательным.
Comments
0 comments