Model uzyskał również 81,2 punktu w teście matematycznym AIME 2025 (wzrost z 65,4 dla GPT-5.3 Instant) oraz 76 punktów w multimodalnym benchmarku rozumowania MMMU-Pro (wzrost z 69,2) .
OpenAI wypuściło nową wersję GPT-5.5 Instant, której celem było udzielanie krótszych, mniej punktowanych i bardziej konwersacyjnych odpowiedzi . Michelle Pokras, kierowniczka badań w OpenAI, określiła poprzedni model jako „zbyt uzależniony od punktorów” i stwierdziła, że nowa wersja przynosi poprawę w zakresie „sykofanii, faktyczności i wydajności wielojęzycznej”
.
Notatki OpenAI mówią, że aktualizacja sprawia, iż GPT-5.5 Instant jest „łatwiejszy do czytania, bardziej naturalny w codziennych rozmowach i lepiej wyważony w praktycznych zadaniach, z mniejszą liczbą zbyt długich lub przeładowanych punktami odpowiedzi” .
Canvas został wycofany zarówno dla GPT-5.5 Instant, jak i GPT-5.5 Thinking. Zadania związane z pisaniem i kodowaniem, które wcześniej korzystały z bocznego panelu Canvas, są teraz wyświetlane jako wbudowane bloki w wątku czatu . Płatni użytkownicy zachowują dostęp do Canvas przez legacy modele w okresie przejściowym
.
Dokumentacja OpenAI potwierdza, że użytkownicy Plus mogą wysłać maksymalnie 160 wiadomości GPT-5.5 co 3 godziny, po czym „system w milczeniu przełączy się na model mini do czasu zresetowania limitu” – polityka ta może wyjaśniać część zgłaszanych niespójności.
Snapshot z 24 czerwca wyróżnia się brakiem szczegółów: żadnych notatek behavioralnych, informacji o funkcjach ani porównań wydajności. Changelog to jedno zdanie . Jest to zgodne z praktyką OpenAI traktowania
chat-latest jako ruchomego celu testowego, ale pozostawia użytkowników i programistów bez jasnych oczekiwań co do zmian.
Twierdzenia, że aktualizacja z 24 czerwca szczególnie poprawiła rozumienie intencji użytkownika, obsługę złożonych ograniczeń czy rekomendacje zakupowe i lokalne, nie mogą być potwierdzone dostępnymi źródłami . Te możliwości były częścią szerszego ekosystemu GPT-5.5 – kwietniowa premiera flagowego GPT-5.5 kładła nacisk na „szybsze zrozumienie, co użytkownik chce zrobić”
, a marcowe notatki ChatGPT wprowadziły interaktywne doświadczenie wyszukiwania zakupowego
– ale żadna z nich nie została powiązana ze snapshotem z 24 czerwca.
Od premiery 5 maja GPT-5.5 Instant przeszedł znaczące ulepszenia w zakresie dokładności faktów, zwięzłości i konwersacyjnego tonu. Snapshot z 24 czerwca kontynuuje schemat regularnych aktualizacji, ale brak dokumentacji uniemożliwia zweryfikowanie konkretnych zmian behawioralnych. Użytkownicy doświadczający niespójności mogą napotykać politykę cichego przełączania na model mini, a nie faktyczne obniżenie jakości. Dla programistów polegających na chat-latest w produkcji brak szczegółów w changelogu oznacza, że testowanie każdego snapshota pod kątem własnego przypadku użycia pozostaje kluczowe.
Comments
0 comments