Ninguno de estos modelos estaba disponible para el público general en el momento del anuncio. Anthropic había considerado a Claude Mythos Preview demasiado peligroso para un lanzamiento sin restricciones, específicamente por sus capacidades de ciberataque, y optó por ofrecerlo solo a un consorcio cuidadosamente seleccionado de socios industriales bajo estricta supervisión . El enfoque de OpenAI con Daybreak fue un poco más amplio —ofreciendo niveles de acceso escalonado, incluyendo un nivel restringido "GPT-5.5-Cyber" reservado para equipos de red team—, pero las capacidades más potentes seguían limitadas a organizaciones validadas como Cisco, CrowdStrike y agencias gubernamentales
.
La herramienta interna de Cisco para estos modelos, la Cisco Foundry Security Spec, fue probada con seis modelos de IA de frontera para asegurar que pudiera funcionar de forma independiente al modelo. En palabras de la propia Cisco, «El modelo es el acelerante; el armazón es el motor» .
Cisco es miembro fundador de los dos principales esfuerzos de la industria para usar IA de frontera en ciberseguridad defensiva.
Project Glasswing de Anthropic: Lanzado en abril de 2026, este proyecto da acceso a Claude Mythos Preview a un grupo selecto de socios bajo condiciones estrictas. El objetivo es encontrar y parchear vulnerabilidades en software crítico antes de que los atacantes puedan explotarlas. Los participantes fundadores incluyen a AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, la Linux Foundation y Cisco . La iniciativa opera bajo un marco de divulgación coordinada, donde las vulnerabilidades se reportan de forma responsable a los mantenedores del software
.
Daybreak de OpenAI: Anunciado el 11 de mayo de 2026, Daybreak es la respuesta institucional directa de OpenAI a Project Glasswing. Construido sobre GPT-5.5 y Codex Security, agrupa tres niveles de modelo bajo un marco de agente de seguridad diseñado para automatizar la revisión de código y la validación de parches a gran escala. Cisco se unió como socio del ecosistema fundador junto a Cloudflare, CrowdStrike y Palo Alto Networks .
Estas dos iniciativas representan una división filosófica fundamental en la industria de la IA. Anthropic ha argumentado que controlar el acceso a los modelos más peligrosos es la mejor manera de impulsar la ciberseguridad global, mientras que OpenAI ha abogado por un acceso más amplio y escalonado —incluyendo a agencias gubernamentales de todos los niveles— para saturar el campo con defensores asistidos por IA .
La motivación declarada de Cisco fue simple: los ataques impulsados por IA ya no son teóricos, y los defensores no pueden permitirse moverse a velocidad humana. Cuando Anthropic anunció que no liberaría Claude Mythos Preview, reveló simultáneamente que el modelo ya había identificado debilidades en infraestructuras de software críticas para internet y la economía en general . La implicación era clara: si los equipos defensivos no usaban estos modelos primero, los adversarios eventualmente tendrían acceso a capacidades equivalentes.
Cisco enmarcó el escaneo de 1.800 millones de líneas como una carrera contra esa inevitabilidad. La compañía señaló que los modelos de frontera «están encontrando vulnerabilidades a una escala que nunca antes se había logrado, y esto no es algo de una sola vez. Estas cosas van a seguir encontrando nuevas vulnerabilidades» . Al ejecutar el escaneo en todo su portafolio, Cisco buscó adelantarse a los atacantes que podrían usar modelos similares para identificar las mismas debilidades, pero con intenciones maliciosas.
A pesar de la fanfarria sobre la velocidad y la escala, Cisco esquivó sistemáticamente la pregunta más importante: ¿cuántas vulnerabilidades encontraron realmente los modelos? Múltiples reportes confirman que Cisco «se negó a revelar el número total de vulnerabilidades» descubiertas, sin ofrecer un recuento, un desglose por gravedad o un número de hallazgos críticos .
Este silencio genera un obvio problema de credibilidad. Si los modelos encontraron miles de errores graves, divulgar esa cifra validaría todo el ejercicio, pero también podría alarmar a clientes y reguladores. Si encontraron relativamente pocos, la narrativa de "ocho semanas contra ocho años" se derrumba. En cualquier caso, Cisco optó por mantener el número en privado mientras alababa el «poder transformador» del esfuerzo de escaneo con IA .
Un cambio concreto y práctico sí surgió en Cisco Live 2026: a partir de julio, Cisco abandonará su anterior modelo de divulgación de vulnerabilidades sin un calendario fijo en favor de un enfoque predecible y programado. La empresa publicará avisos de seguridad el primer y tercer miércoles de cada mes, acompañados de un aviso con siete días de antelación que enumera las tecnologías y plataformas que se tratarán en cada publicación .
La razón está directamente ligada al programa de escaneo con IA. El Equipo de Respuesta a Incidentes de Seguridad de Productos (PSIRT) de Cisco espera que el descubrimiento acelerado de vulnerabilidades por IA aumente drásticamente el volumen de hallazgos, y una cadencia quincenal está diseñada para dar a los clientes empresariales la predictibilidad que necesitan para planificar ciclos de parcheo, en lugar de tener que reaccionar a avisos sorpresivos . Si no hay publicaciones de seguridad planificadas para una ventana determinada, Cisco también lo comunicará
.
Mientras Cisco escaneaba su propio código, el Instituto de Seguridad de IA (AISI) del Reino Unido evaluaba de forma independiente los dos modelos que Cisco utilizó, y los hallazgos fueron aleccionadores. En una serie de evaluaciones publicadas entre abril y junio de 2026, el AISI encontró lo siguiente :
Claude Mythos Preview es «sustancialmente más capaz en ciberataques que cualquier modelo que hayamos evaluado previamente». El gobierno del Reino Unido citó este hallazgo directamente en una carta abierta de abril de 2026 de la Secretaria de Estado Liz Kendall y el Ministro de Seguridad Dan Jarvis a todos los líderes empresariales del Reino Unido, instando a las juntas directivas a tratar el riesgo cibernético potenciado por IA como una responsabilidad de gobierno corporativo de primer orden . Mythos Preview logró una tasa de éxito del 73% en tareas de capturar la bandera (CTF) de nivel experto, siendo la primera vez para cualquier modelo evaluado por el instituto
.
GPT-5.5 completó de principio a fin la simulación de ataque a una red corporativa de 32 pasos del AISI, un punto de referencia que el instituto estima le tomaría a un experto humano unas 20 horas. El modelo también llegó al límite de muchas de las 95 tareas de ciberataque CTF del AISI, volviendo insuficientes los puntos de referencia básicos para medir el riesgo cibernético de los modelos de frontera . En las tareas avanzadas de nivel experto, GPT-5.5 logró una tasa de aprobación promedio de aproximadamente el 71%, en comparación con el 69% de Mythos Preview y el 52% de la generación anterior, GPT-5.4
.
La tendencia general se está acelerando: el AISI encontró que la capacidad de los modelos de IA de frontera para completar tareas cibernéticas de forma autónoma se está duplicando cada 4,7 meses, una fuerte caída desde el intervalo de 8 meses que el instituto registró en noviembre de 2025. Tanto Claude Mythos Preview como GPT-5.5 superaron sustancialmente incluso esta línea de tendencia más pronunciada .
Las implicaciones de una tasa de duplicación de 4,7 meses son crudas. Si la tendencia se mantiene, en aproximadamente un año y medio, los sistemas de IA podrían completar de forma autónoma tareas cibernéticas que hoy requieren equipos de operadores humanos expertos trabajando durante semanas o meses. El AISI señaló que los puntos de control más recientes de ambos modelos ya habían saturado la suite de evaluación de 95 tareas existente, produciendo «horizontes temporales muy inciertos» porque los puntos de referencia ya no podían medir el alcance completo de las capacidades de los modelos .
El anuncio de Cisco, junto con las evaluaciones del AISI, pinta el cuadro de una industria que ha aceptado, y está participando activamente en, una carrera armamentista defensiva impulsada por la IA. Los mismos modelos de frontera que pueden escanear 1.800 millones de líneas de código en busca de vulnerabilidades pueden, en teoría, ser utilizados por atacantes para encontrar y explotar esas mismas vulnerabilidades más rápido que cualquier equipo humano de red team.
La lógica tanto de Project Glasswing como de Daybreak es que la mejor defensa es dar los modelos más capaces a las organizaciones más responsables primero, bajo estrictos controles, para que puedan parchear la infraestructura crítica antes de que las capacidades ofensivas se multipliquen. El escaneo de 1.800 millones de líneas de código de Cisco es la prueba de concepto más grande del mundo real de esa tesis hasta la fecha. Sin embargo, la decisión de la compañía de ocultar el número real de bugs deja al resto de la industria con una prueba de concepto tentadora pero incompleta, y una nueva cadencia de divulgación impulsada por IA que sugiere que el volumen de hallazgos fue lo suficientemente significativo como para requerir un cambio operativo permanente.
Comments
0 comments