Il modello ha anche ottenuto un punteggio di 81,2 nel test di matematica AIME 2025, rispetto al 65,4 di GPT-5.3 Instant, e un 76 nel benchmark di ragionamento multimodale MMMU-Pro, rispetto al 69,2 .
OpenAI ha distribuito una nuova versione di GPT-5.5 Instant con l'obiettivo di rendere le risposte più brevi, meno ricche di elenchi puntati e più colloquiali . Michelle Pokras, responsabile della ricerca OpenAI, ha descritto il modello precedente come "troppo dipendente dai punti elenco" e ha affermato che la nuova versione migliorava "sotto vari aspetti importanti: servilismo, accuratezza fattuale e performance multilingua"
.
Le note di rilascio di OpenAI affermano che l'aggiornamento rende GPT-5.5 Instant "più facile da leggere, più naturale nelle conversazioni quotidiane e con un ritmo migliore nelle attività di aiuto pratico, con risposte meno lunghe o troppo ricche di elenchi puntati" .
Canvas è stato ritirato sia per GPT-5.5 Instant che per GPT-5.5 Thinking. I task di scrittura e codifica che in precedenza utilizzavano il pannello laterale Canvas ora appaiono come blocchi di scrittura e blocchi di codice incorporati nel thread di chat . Gli utenti paganti mantengono l'accesso a Canvas attraverso modelli legacy durante un periodo di transizione
.
La stessa documentazione di OpenAI conferma che gli utenti Plus possono inviare un massimo di 160 messaggi GPT-5.5 ogni 3 ore, dopo di che "il sistema passerà silenziosamente al modello mini fino al ripristino della quota" — una politica che potrebbe spiegare parte dell'incoerenza percepita.
Lo snapshot del 24 giugno si distingue per ciò che gli manca: nessun dettaglio comportamentale, nessuna nota sulle funzionalità, nessun confronto delle performance. Il changelog è una riga unica . Questo è coerente con la prassi di OpenAI di trattare
chat-latest come un target mobile per i test, ma lascia utenti e sviluppatori senza aspettative chiare su cosa sia cambiato.
Le affermazioni secondo cui l'aggiornamento del 24 giugno avrebbe specificamente migliorato la comprensione dell'intento dell'utente, la gestione di vincoli complessi o i suggerimenti per acquisti e attività locali non possono essere confermate dalle fonti disponibili . Queste capacità facevano parte dell'ecosistema GPT-5.5 più ampio — il lancio del modello principale GPT-5.5 del 23 aprile sottolineava la capacità di "capire più velocemente cosa stai cercando di fare"
, e le note di rilascio di ChatGPT del marzo 2026 introducevano un'esperienza interattiva di ricerca per gli acquisti
— ma nessuna delle due è stata legata allo snapshot del 24 giugno.
Dal suo lancio il 5 maggio, GPT-5.5 Instant ha visto miglioramenti significativi in termini di accuratezza fattuale, concisione delle risposte e tono conversazionale. Lo snapshot del 24 giugno continua il modello di aggiornamenti regolari ma manca di documentazione per verificare specifici cambiamenti comportamentali. Gli uteri che sperimentano incoerenza potrebbero trovarsi di fronte alla politica di passaggio silenzioso al modello mini, non a un degrado del modello stesso. Per gli sviluppatori che si affidano a chat-latest in produzione, la mancanza di dettagli nel changelog rende essenziale testare ogni snapshot sul proprio caso d'uso.
Comments
0 comments