Das Modell erreichte zudem einen Wert von 81,2 im AIME 2025 Mathetest (gegenüber 65,4 bei GPT-5.3 Instant) und 76 im MMMU-Pro multimodalem Benchmark (gegenüber 69,2) .
OpenAI veröffentlichte eine neue Version von GPT-5.5 Instant mit dem Ziel, Antworten kürzer, weniger aufzählungszeichenlastig und konversationeller zu gestalten . Michelle Pokras, Forschungsleiterin bei OpenAI, bezeichnete das vorherige Modell als „zu sehr auf Aufzählungszeichen fixiert“ und sagte, die neue Version verbessere „Speichelleckerei, Faktentreue und mehrsprachige Leistung“
.
Die Veröffentlichungshinweise von OpenAI besagen, dass das Update GPT-5.5 Instant „leichter lesbar, natürlicher in alltäglichen Gesprächen und besser abgestimmt auf praktische Hilfsaufgaben macht, mit weniger übermäßig langen oder aufzählungszeichenlastigen Antworten“ .
Canvas wurde eingestellt – sowohl für GPT-5.5 Instant als auch für GPT-5.5 Thinking. Schreib- und Codierungsaufgaben, die zuvor das Canvas-Seitenfenster nutzten, erscheinen nun als Inline-Schreibblöcke und Codeblöcke im Chat-Thread . Zahlende Nutzer behalten während einer Übergangsphase über Legacy-Modelle Zugriff auf Canvas
.
Die eigene Dokumentation von OpenAI bestätigt, dass Plus-Nutzer maximal 160 GPT-5.5-Nachrichten alle 3 Stunden senden können, wonach „das System stillschweigend auf das Mini-Modell umschaltet, bis das Kontingent zurückgesetzt ist“ – eine Regelung, die die wahrgenommene Inkonsistenz erklären könnte.
Der Snapshot vom 24. Juni sticht durch das hervor, was ihm fehlt: keine Verhaltensdetails, keine Funktionshinweise und keine Leistungsvergleiche. Der Changelog ist eine einzelne Zeile . Dies entspricht der Praxis von OpenAI,
chat-latest als rollierendes Ziel für Tests zu behandeln, lässt aber Nutzer und Entwickler ohne klare Erwartungen, was sich geändert hat.
Behauptungen, dass das Update vom 24. Juni speziell das Verständnis der Nutzerabsicht, die Handhabung komplexer Anforderungen oder Shopping- und Lokalempfehlungen verbessert habe, können anhand der verfügbaren Quellen nicht bestätigt werden . Diese Fähigkeiten waren Teil des breiteren GPT-5.5-Ökosystems – der Start des Flaggschiffs GPT-5.5 am 23. April betonte, „schneller zu verstehen, was du zu tun versuchst“
, und die ChatGPT-Veröffentlichungshinweise vom März 2026 führten eine interaktive Shopping-Research-Erfahrung ein
– aber keines davon war an den Snapshot vom 24. Juni gebunden.
Seit seinem Start am 5. Mai hat GPT-5.5 Instant bedeutende Verbesserungen bei der faktischen Genauigkeit, der Prägnanz der Antworten und dem Konversationston erfahren. Der Snapshot vom 24. Juni setzt das Muster regelmäßiger Updates fort, entbehrt jedoch einer Dokumentation, die spezifische Verhaltensänderungen überprüfbar macht. Nutzer, die Inkonsistenzen erleben, stoßen möglicherweise auf die stille Mini-Modell-Fallback-Regelung und nicht auf eine echte Modellverschlechterung. Für Entwickler, die in der Produktion auf chat-latest angewiesen sind, bleibt das Testen jedes Snapshots gegen den eigenen Anwendungsfall aufgrund der fehlenden Changelog-Details unerlässlich.
Comments
0 comments