En internet ya circulan titulares, capturas y vídeos sobre GPT-5.5 «Spud». El problema es que casi todo lo llamativo —benchmarks espectaculares, demos de mundos 3D, fecha de lanzamiento y nombre comercial— todavía no pasa una verificación independiente. Con las fuentes disponibles, lo más sólido es bastante más estrecho: hay reportes de medios que hablan de un modelo de OpenAI con nombre en clave «Spud», y The Decoder recoge que ese modelo habría terminado su preentrenamiento; pero eso no equivale a un lanzamiento oficial, una entrada en la API, una model card, una system card ni un benchmark reproducible.[23][
26][
21]
La respuesta corta: Spud puede existir, pero «GPT-5.5» no está confirmado
La pista más fuerte sobre Spud no viene de una captura viral ni de un vídeo de YouTube, sino de una cadena de reportes periodísticos. The Information publicó una pieza titulada «OpenAI CEO Shifts Responsibilities, Preps ‘Spud’ AI Model»; después, The Decoder informó que OpenAI habría terminado el preentrenamiento de un nuevo modelo con nombre en clave Spud, según un memo interno atribuido a Sam Altman.[23][
26]
Eso basta para tratar «Spud» como una hipótesis seria sobre un posible nombre interno de OpenAI. Pero no basta para afirmar que ya exista un producto público llamado GPT-5.5. En la fuente de OpenAI API Models incluida en este material aparecen gpt-5.4, gpt-5.4-mini y gpt-5.4-nano; no aparece una confirmación de Spud o GPT-5.5 como modelo disponible públicamente.[21]
Dicho de otro modo: Spud es un nombre en clave reportado para un posible modelo interno de OpenAI; su nombre público, sus capacidades, sus puntuaciones y su fecha de salida siguen sin estar confirmados por documentación oficial o benchmarks reproducibles.[23][
26][
21]
Qué cuenta como prueba en una filtración de modelos de IA
Para evaluar rumores de IA conviene mirar menos el volumen de retuits y más la trazabilidad de la prueba. Un estándar razonable incluiría:
- Documentación oficial: lista de modelos de la API, notas de lanzamiento, model card o system card.
- Artefactos públicos de evaluación: fila en un leaderboard, eval card, run log, conjunto de prompts o registro de envío.
- Demo original: vídeo completo, prompt, flujo de generación, nombre del modelo y marca temporal.
- Reproducibilidad: que un tercero pueda repetir el método y obtener resultados comparables.
Con ese listón, la existencia y el estado de entrenamiento de Spud tienen apoyo en reportes de medios; los benchmarks, demos, fechas de salida y la etiqueta GPT-5.5, en cambio, siguen mayoritariamente sin verificar.[23][
26][
3][
4][
21]
Mapa rápido de credibilidad
| Afirmación que circula | Qué se puede comprobar ahora | Veredicto |
|---|---|---|
| OpenAI tiene un nuevo modelo con nombre en clave «Spud» | The Information menciona que OpenAI prepara un modelo «Spud»; The Decoder afirma que OpenAI habría terminado el preentrenamiento de un modelo con ese nombre en clave.[ | Parcialmente respaldado por medios, no confirmado oficialmente |
| Spud ya está disponible o saldrá como GPT-5.5 | La fuente de OpenAI API Models consultada lista la familia gpt-5.4, no Spud ni GPT-5.5.[ | No verificado |
| Spud iguala o supera a Claude Mythos en benchmarks | En el texto de Holter, el 77,80 % corresponde a Claude Mythos Preview en SWE-bench Pro y el 57,70 % a GPT-5.4; la referencia a Spud está formulada como expectativa, no como resultado original.[ | No verificado |
| SWE-bench ya tiene una puntuación de Spud | SWE-bench publica leaderboards, pero las fuentes de este material no aportan una entrada, resultado o eval card verificable para Spud.[ | No verificado |
| Las demos de mundos 3D, SVG, webs y juegos prueban las capacidades de Spud | Geeky Gadgets atribuye esas demos a Universe of AI y señala que las métricas oficiales de rendimiento siguen sin publicarse.[ | Indicio de segunda mano, no prueba |
| El lanzamiento será el 16 de abril, en el segundo trimestre de 2026, y se llamará GPT-5.5 | Algunos artículos hablan de GPT-5.5 y de abril-mayo de 2026; Holter usa fórmulas como «Leaked April 16 Release» y «GPT-5.5 or GPT-6 Might Mean», que son expresiones de incertidumbre.[ | Rumor, no confirmado |
| Una publicación en OpenAI Developer Community confirma «SPUD Release» | El título citado es «Please Add an Optional Expression Mode with the SPUD Release» y el contexto es una petición de función, no una nota oficial de lanzamiento ni documentación de API.[ | No sirve como confirmación oficial |
Benchmarks: el gran malentendido está en leer como de Spud datos que no lo son
La parte que más se ha amplificado es la de los benchmarks. En el artículo de Adam Holter se citan dos cifras concretas: Claude Mythos Preview con 77,80 % en SWE-bench Pro y GPT-5.4 con 57,70 %. Pero el texto no presenta esas cifras como resultados de Spud; lo que dice sobre Spud es que la expectativa sería que cerrara buena parte, o toda, esa brecha.[3]
Por tanto, esos números solo permiten decir que algunos comentaristas están usando resultados de otros modelos para especular sobre lo que Spud podría lograr. No permiten afirmar que Spud ya tenga una puntuación independiente y verificable.
Para que un benchmark de Spud fuera una prueba fuerte haría falta ver, como mínimo, uno de estos elementos: un informe oficial de evaluación, una model card, una system card, una fila pública en un leaderboard, una eval card, logs de ejecución, prompts, un envío identificable o una prueba reproducida por terceros.
SWE-bench sí ofrece leaderboards públicos que sirven para contrastar afirmaciones sobre rendimiento en tareas de programación, pero en el material disponible aquí no aparece ninguna entrada verificable atribuible a Spud.[30]
Demos: útiles como pista, insuficientes como prueba
También circulan supuestas demos de Spud generando simulaciones 3D, entornos interactivos, diseños web, SVG y juegos a partir de prompts. Que una demo parezca impresionante no resuelve las dos preguntas clave: ¿de verdad la generó Spud? y ¿puede reproducirse?
La propia cobertura de Geeky Gadgets se formula como información «According to Universe of AI» y reconoce que las métricas oficiales de rendimiento siguen sin estar disponibles.[4] Eso coloca estas demos en la categoría de material de segunda mano: pueden ser una pista para seguir investigando, pero no una prueba sólida de capacidad del modelo.
Para subir de nivel, una demo necesitaría el vídeo original completo, el prompt usado, el proceso de generación, el nombre del modelo, una marca temporal y pasos de reproducción. Una página oficial de OpenAI también cambiaría el peso de la evidencia. Sin eso, una captura o un vídeo aislado no bastan.
Fechas y nombre comercial: GPT-5.5, GPT-6 y «16 de abril» siguen en el aire
Las afirmaciones sobre fecha de salida y nombre son las más atractivas para titulares, pero también las más frágiles. Hay artículos que ya empaquetan Spud como GPT-5.5 y hablan de una ventana en el segundo trimestre o abril-mayo de 2026.[1] En paralelo, el título de Holter usa expresiones como «Leaked April 16 Release» y «What GPT-5.5 or GPT-6 Might Mean», que no equivalen a una confirmación oficial.[
3]
Desde una perspectiva de verificación, la regla es simple: hasta que OpenAI lo liste en documentación de modelos, API, notas de lanzamiento o blog oficial, «GPT-5.5» debe tratarse como etiqueta externa o especulación, no como nombre de producto confirmado. La fuente de OpenAI API Models disponible aquí no confirma Spud ni GPT-5.5 como modelos públicos.[21]
El foro de desarrolladores no es una nota de lanzamiento
Otro detalle fácil de sacar de contexto es una mención a «SPUD Release» en OpenAI Developer Community. La página citada se titula «Please Add an Optional Expression Mode with the SPUD Release» y, por su propio planteamiento, funciona como una petición de función de la comunidad.[13]
Eso puede demostrar que hay usuarios hablando de Spud. No demuestra que OpenAI haya anunciado el modelo, ni que haya fecha de salida, ni que exista una entrada de API.
Qué deberían hacer equipos técnicos y de producto
Si estás evaluando modelos para flujos de programación, agentes de IA, una hoja de ruta de producto o una decisión de compra, lo prudente es no tratar los rumores de Spud como datos operativos. Una forma segura de proceder sería:
- Usar la documentación oficial de modelos como referencia de disponibilidad. En la fuente consultada de OpenAI API Models aparecen modelos gpt-5.4, no Spud ni GPT-5.5.[
21]
- Para capacidades de código, exigir resultados públicos en leaderboards, eval cards o pruebas reproducibles; SWE-bench es una de las fuentes que conviene revisar cuando se discuten benchmarks de programación.[
30]
- Para demos, pedir artefactos originales: prompt completo, nombre del modelo, vídeo o registro del flujo y pasos de reproducción.[
4]
- Para nombre comercial y fecha de lanzamiento, esperar una nota oficial o una entrada en la API. Palabras como «leaked», «expected» o «might» son señales de incertidumbre, no de confirmación.[
1][
3]
Veredicto
Spud puede ser real como proyecto o nombre interno: hay reportes identificables que dicen que OpenAI prepara un modelo con ese nombre en clave y que habría completado el preentrenamiento.[23][
26] Pero la conclusión verificable se queda ahí. Por ahora, no hay base suficiente para tratar como hechos los benchmarks atribuidos a Spud, las demos virales, una fecha concreta de lanzamiento o el nombre GPT-5.5.[
3][
4][
21][
30]
La formulación más precisa sería esta: Spud es un nombre en clave de OpenAI reportado por medios; su nombre público, rendimiento, puntuaciones y calendario de lanzamiento aún no están confirmados por documentación oficial de OpenAI ni por benchmarks reproducibles.[21][
30]




