En declaraciones a medios como la BBC y Moneycontrol, Palmiotti explicó que la tecnología está evolucionando a un ritmo que podría dejar fuera de juego al talento humano de más alto nivel. Predijo que los concursos de hacking con IA podrían hacer obsoletas competiciones como Pwn2Own, porque la velocidad bruta, la escala y la autonomía de sistemas como Mythos no pueden ser igualadas por ningún individuo humano, por muy hábil que sea .
Es crucial entender que su advertencia no es que la IA vaya a reemplazar de inmediato a todos los investigadores, sino que está cruzando un umbral de capacidad que modifica la economía de quién —o qué— encuentra primero las vulnerabilidades más críticas. La trayectoria, argumenta, apunta hacia las máquinas .
Claude Mythos Preview no es una herramienta de ciberseguridad especializada. Es un modelo de lenguaje de propósito general, el sucesor de última generación de Anthropic a su línea Claude. No fue entrenado para hackear. Sin embargo, cuando se evaluaron sus capacidades, los resultados sorprendieron incluso a sus creadores .
Anthropic confirmó que Mythos Preview descubrió de forma autónoma miles de vulnerabilidades de alta gravedad en todos los sistemas operativos y navegadores web principales. Esto incluye fallos previamente desconocidos (día cero) que ningún investigador humano había encontrado aún . Un informe lo describe como 303 páginas de hallazgos de vulnerabilidad en 21 minutos
.
Los modelos de IA anteriores podían a veces encontrar vulnerabilidades, pero casi nunca construir un exploit funcional de manera autónoma. En una prueba que consistía en convertir vulnerabilidades conocidas del motor JavaScript de Firefox en exploits de shell funcionales, Mythos Preview tuvo éxito 181 veces. El anterior mejor modelo de Anthropic, Claude Opus 4.6, tenía una tasa de éxito cercana a cero. Esto no es una mejora incremental: representa un umbral que ha sido cruzado .
Mythos puede analizar software de código cerrado o compilado incluso después de que se haya eliminado la información de depuración legible por humanos. Examina el código a nivel de máquina, comprende cómo funciona el programa y descubre vulnerabilidades que serían opacas sin acceso al código fuente .
Los investigadores utilizaron un andamiaje sencillo: aislaron el código objetivo en un contenedor, invocaron el modelo con Claude Code ejecutando Mythos Preview, y le dieron una instrucción de un solo párrafo pidiéndole que encontrara vulnerabilidades. El modelo identificó y escribió exploits para brechas de seguridad previamente desconocidas de forma independiente . El Instituto de Seguridad de IA del Reino Unido (AISI) evaluó Mythos de forma independiente y confirmó sus avanzadas capacidades cibernéticas
.
Anthropic fue explícito: las capacidades cibernéticas ofensivas del modelo no fueron entrenadas deliberadamente. "Surgieron como una consecuencia secundaria de las mejoras generales en código, razonamiento y autonomía" . Las mismas mejoras que hacen al modelo más efectivo parcheando vulnerabilidades también lo hacen más efectivo explotándolas. Esto tiene enormes implicaciones de gobernanza: si la capacidad ofensiva es una propiedad emergente del poder de razonamiento general, futuros modelos aún más capaces podrían ser imposibles de asegurar sin limitar fundamentalmente su inteligencia
.
Cuando Anthropic lanzó Claude Mythos Preview en abril de 2026, hizo algo que ningún laboratorio de IA importante había hecho antes: anunció su modelo más potente y simultáneamente dijo al público que no podía usarlo .
La compañía creó el Proyecto Glasswing, un programa de acceso restringido que limita Mythos Preview a unas 50 organizaciones cuidadosamente seleccionadas. Entre ellas se incluyen gigantes tecnológicos como Apple, Amazon Web Services, Microsoft, Google, Cisco, CrowdStrike, Broadcom, Palo Alto Networks y Nvidia, así como operadores de infraestructuras críticas como JPMorgan Chase. Entidades del gobierno de EE. UU., incluida la Agencia de Seguridad Nacional (NSA), también recibieron acceso . El objetivo es blindar primero el software más crítico del mundo, dando ventaja a los defensores antes de que prolifere inevitablemente una IA ofensiva similar o más capaz
.
El razonamiento de Anthropic es claro: el modelo es sencillamente demasiado peligroso para un lanzamiento amplio. La compañía reconoció que Mythos está "actualmente muy por delante de cualquier otro modelo de IA en capacidades cibernéticas" y que "presagia una ola de modelos capaces de explotar vulnerabilidades de formas que superan con creces los esfuerzos de los defensores" . En manos equivocadas, podría orquestar ciberataques coordinados contra redes eléctricas, hospitales y sistemas financieros
.
La situación escaló cuando Anthropic propuso ampliar el acceso de unas 50 organizaciones a 120. La Casa Blanca bloqueó esa expansión, el primer caso conocido de una restricción gubernamental estadounidense al despliegue comercial de un modelo de IA basada en consideraciones políticas, y no en una ley o regulación específica . Los responsables citaron el temor a que el modelo cayera en manos adversarias y dudas sobre si Anthropic tiene suficiente capacidad de cómputo para servir a un mayor número de usuarios sin degradar el servicio para socios federales críticos
.
Mientras tanto, el Pentágono anunció alianzas de IA en redes clasificadas con ocho empresas —OpenAI, Google, Microsoft, AWS, Nvidia, SpaceX, Oracle y xAI— y excluyó deliberadamente a Anthropic de la lista, lo que indica crecientes tensiones entre la empresa y el establishment de defensa estadounidense .
Por ahora, Mythos permanece bajo llave. Los tres megabancos de Japón obtuvieron acceso en mayo de 2026, convirtiendo al país en uno de los primeros fuera de EE. UU. en usar el modelo de forma defensiva .
La llegada de Claude Mythos ha encendido un urgente debate filosófico en ciberseguridad. ¿Tienen los investigadores humanos un futuro viable, o estamos presenciando el principio del fin?
1. La IA aumenta, aún no reemplaza. La propia Palmiotti usa Claude Code para mejorar su eficiencia, confiando en la habilidad humana para el contexto y el razonamiento creativo. Muchos investigadores sostienen que la experiencia humana sigue siendo crítica para la estrategia de alto nivel, comprender el propósito y la lógica de negocio de un sistema, y el razonamiento creativo en cadena de ataque que los modelos aún no pueden replicar .
2. Los controles de acceso preservan los roles humanos, por ahora. Mythos está limitado a unas 50 organizaciones. La abrumadora mayoría de los programas de bug bounty, pruebas de penetración y evaluaciones de vulnerabilidad siguen siendo realizadas por humanos con herramientas mucho menos capaces. Si bien esto cambia la frontera del conocimiento, no disuelve la enorme industria existente .
3. Dominios novedosos y juicio. Los humanos conservan ventajas en la detección de fallos de lógica de negocio, la realización de evaluaciones matizadas de ingeniería social y la provisión de juicio contextual basado en el riesgo que los modelos de IA actuales pueden pasar por alto o malinterpretar. Una IA puede encontrar un desbordamiento de búfer técnicamente explotable; un investigador humano puede decirte si ese desbordamiento realmente importa en el contexto del negocio .
1. La velocidad y escala brutas están fuera del alcance humano. Mythos puede ingerir bases de código enteras, encontrar vulnerabilidades y escribir exploits en minutos, un trabajo que a un equipo humano cualificado le llevaría semanas o meses. Una publicación lo describió como "una IA que puede entrar en casi cualquier ordenador de la Tierra" tras encontrar miles de vulnerabilidades desconocidas en todos los sistemas operativos principales simultáneamente .
2. Los concursos de élite se convierten en escaparates de IA. La predicción de Palmiotti de que competiciones como Pwn2Own pueden quedar obsoletas no es una simple sensación, sino una observación estructural. Si un solo modelo puede encontrar y encadenar vulnerabilidades que de otro modo requerirían múltiples equipos de élite, la economía de la caza de vulnerabilidades cambia fundamentalmente .
3. Las ventajas de coste y eficiencia son abrumadoras. Un único sistema de IA puede escanear millones de líneas de código, conectar pequeñas vulnerabilidades en cadenas de exploits críticas y operar a una escala que ningún humano puede mantener. Esto cambia fundamentalmente lo que es posible en el descubrimiento de vulnerabilidades, no porque los humanos sean ineficaces, sino porque no pueden competir en volumen .
Es poco probable que el debate se resuelva de forma limpia. Lo más probable es que el futuro inmediato se bifurque: un círculo interno de defensores aumentados por IA usando herramientas como Mythos bajo un estricto acceso gubernamental y corporativo, y un vasto círculo externo donde la mayor parte del trabajo de seguridad sigue siendo obstinadamente manual y humano. La distancia entre esos dos círculos se está estrechando.
Comments
0 comments