El modelo también obtuvo una puntuación de 81.2 en la prueba de matemáticas AIME 2025, frente al 65.4 de GPT-5.3 Instant, y un 76 en el punto de referencia de razonamiento multimodal MMMU-Pro, frente al 69.2 .
OpenAI lanzó una nueva versión de GPT-5.5 Instant con el objetivo de hacer las respuestas más cortas, menos cargadas de viñetas y más conversacionales . Michelle Pokras, responsable de investigación de OpenAI, describió el modelo anterior como "demasiado adicto a las viñetas" y dijo que la nueva versión mejoraba en "adulación, veracidad y rendimiento multilingüe"
.
Las notas de la versión de OpenAI indican que la actualización hace que GPT-5.5 Instant sea "más fácil de leer, más natural en las conversaciones cotidianas y con un mejor ritmo en tareas prácticas de ayuda, con menos respuestas excesivamente largas o cargadas de viñetas" .
Canvas fue retirado tanto para GPT-5.5 Instant como para GPT-5.5 Thinking. Las tareas de escritura y codificación que antes usaban el panel lateral de Canvas ahora aparecen como bloques de escritura y bloques de código en línea dentro del hilo de chat . Los usuarios de pago conservan el acceso a Canvas a través de modelos heredados durante un período de transición
.
La propia documentación de OpenAI confirma que los usuarios Plus pueden enviar un máximo de 160 mensajes de GPT-5.5 cada 3 horas, tras lo cual "el sistema cambiará silenciosamente al modelo mini hasta que se restablezca la cuota" , una política que puede explicar parte de la inconsistencia percibida.
El 'snapshot' del 24 de junio destaca por lo que no tiene: ningún detalle de comportamiento, ninguna nota de función y ninguna comparación de rendimiento. El registro de cambios es una sola línea . Esto es coherente con la práctica de OpenAI de tratar
chat-latest como un objetivo móvil para pruebas, pero deja a usuarios y desarrolladores sin expectativas claras sobre lo que cambió.
Las afirmaciones de que la actualización del 24 de junio mejoró específicamente la comprensión de la intención del usuario, el manejo de restricciones complejas o las recomendaciones de compras y lugares no pueden confirmarse a partir de las fuentes disponibles . Estas capacidades formaban parte del ecosistema más amplio de GPT-5.5 —el lanzamiento emblemático de GPT-5.5 el 23 de abril enfatizó "entender lo que intentas hacer más rápido"
, y las notas de la versión de ChatGPT de marzo de 2026 introdujeron una experiencia interactiva de investigación de compras
—, pero ninguna de ellas estaba vinculada al 'snapshot' del 24 de junio.
Desde su lanzamiento el 5 de mayo, GPT-5.5 Instant ha recibido mejoras significativas en precisión factual, concisión de respuesta y tono conversacional. El 'snapshot' del 24 de junio continúa el patrón de actualizaciones periódicas, pero carece de documentación para verificar cambios de comportamiento específicos. Los usuarios que experimenten inconsistencia pueden estar encontrando la política de cambio silencioso al modelo mini, no una degradación del modelo. Para los desarrolladores que dependen de chat-latest en producción, la falta de detalle en el registro de cambios hace que probar cada 'snapshot' con su caso de uso siga siendo esencial.
Comments
0 comments