Según el Marco de Preparación de OpenAI, GPT-5.5 recibió una calificación de capacidad de ciberseguridad 'Alta', lo que significa que se mantiene por debajo del umbral 'Crítico', definido como la capacidad de desarrollar exploits de día cero de forma autónoma sin ayuda humana . En una medición, el GPT-5.5 (y la variante Cyber) completó una simulación de ataque de red de 32 pasos, reportado como el segundo modelo de IA en lograrlo, después del Mythos de Anthropic
.
OpenAI lanzó un plugin Codex Security actualizado que integra el descubrimiento, la validación y el parcheo de vulnerabilidades directamente en el flujo de trabajo del desarrollador dentro de Codex . El plugin está diseñado para ir más allá del análisis estático: puede construir o inferir un modelo de amenazas, identificar vulnerabilidades plausibles, determinar si el código afectado es accesible, recopilar pruebas de validación, desarrollar parches específicos y verificar el resultado
. OpenAI afirma que el plugin incorpora las lecciones aprendidas del uso interno y de los clientes para acelerar la búsqueda y corrección de vulnerabilidades en los sistemas existentes, al mismo tiempo que ayuda a evitar que surjan nuevas vulnerabilidades en el entorno de producción
. Desde su vista previa de investigación en marzo de 2026, el plugin Codex Security ya había escaneado más de 30 millones de commits en más de 30 000 bases de código, y los revisores humanos habían marcado manualmente más de 70 000 hallazgos
.
'Patch the Planet' es la iniciativa de código abierto central de la expansión Daybreak, creada en colaboración con Trail of Bits, HackerOne y Calif . OpenAI lo describe como 'un esfuerzo para ayudar a los mantenedores de código abierto a pasar de los hallazgos de seguridad a las correcciones fusionadas', con la revisión humana como eje central
. El programa financia a ingenieros de seguridad dedicados de Trail of Bits que trabajan a tiempo completo con Codex y GPT-5.5-Cyber en proyectos de código abierto, con el objetivo no solo de encontrar errores, sino también de escribir y enviar parches fusionados
.
Trail of Bits organizó un sprint inicial de cinco días con 25 ingenieros que trabajaron directamente con los mantenedores de proyectos de código abierto . Resultados en 19 proyectos (con más de 30 que se comprometieron a participar)
:
Entre los ejemplos notables de hallazgos se incluyen 8 pruebas de concepto de fuga de punteros del kernel de Linux, 24 vectores de escalada de privilegios locales en utilidades del sistema, más de 10 vulnerabilidades explotables en Safari, un CVE de WebAssembly en Firefox (CVE-2026-8390) parcheado antes de Pwn2Own, y cuatro de seis CVE de dnsmasq señalados de forma independiente antes de su corrección pública . Los proyectos cubiertos incluyeron cURL, NATS, pyca/cryptography, Sigstore, aiohttp, el proyecto Go, freenginx, Python y python.org, urllib3, PyPI, SimpleX, Valkey y RustCrypt
. Los ingenieros de Trail of Bits utilizaron ejecuciones repetidas de Codex
/goal con GPT-5.5-Cyber para construir un laboratorio de 'fuzzing' completo que cubría docenas de puntos de entrada, plataformas y semillas de prueba novedosas en menos de una semana, una tarea que, según estiman, normalmente habría llevado al menos varias semanas .
Los mantenedores participantes también reciben seis meses de ChatGPT Pro de OpenAI, que incluye acceso condicional a Codex Security para codificación, automatizaciones y flujos de trabajo .
OpenAI lanzó el Programa de Socios de Ciberseguridad Daybreak, una iniciativa solo por invitación que brinda a los proveedores de seguridad acceso a las capacidades de ciberseguridad de frontera de OpenAI (incluido GPT-5.5 con Trusted Access) para integrarlas en sus propios productos y servicios . El programa tiene como objetivo 'impulsar productos construidos sobre nuestras mejores capacidades cibernéticas para que las principales empresas de seguridad protejan el software del mundo'
.
Una lista de socios anterior más amplia del lanzamiento de Daybreak en mayo de 2026 también incluía a Cloudflare, Oracle, Zscaler, Akamai, Fortinet, Intel, Qualys, Rapid7, Trail of Bits, SpecterOps, SentinelOne, Netskope, Snyk, Gen Digital, Semgrep y Socket .
La expansión posiciona directamente a Daybreak de OpenAI frente al proyecto Glasswing y el modelo Mythos de Anthropic. Según la evidencia disponible, los dos esfuerzos difieren en estrategia y presentan un panorama competitivo dinámico:
En general, las dos empresas se alternan el liderazgo en diferentes pruebas de referencia y dominios de capacidad. El énfasis de OpenAI en la democratización (parcheo de código abierto, integraciones amplias con socios y herramientas integradas para desarrolladores) contrasta con la estrategia de implementación más controlada y centrada en la élite de Anthropic. Ambos modelos siguen siendo de vanguardia en sus respectivas áreas de fortaleza, y es probable que la dinámica competitiva continúe evolucionando.
Comments
0 comments