Debido a que esas mismas capacidades también podrían facilitar ataques, Anthropic optó por un modelo de acceso controlado en lugar de una API pública.
En la primera actualización oficial del programa, Anthropic afirmó que los resultados iniciales fueron inusualmente grandes para un periodo tan corto.
Entre los datos reportados:
Un caso citado por la empresa es Cloudflare, que informó haber descubierto cerca de 2.000 errores en sus servicios principales, incluidos 400 considerados críticos o de alta gravedad.
Estos números sugieren que herramientas de IA podrían permitir revisar bases de código enormes mucho más rápido que las auditorías manuales tradicionales.
Algunas evaluaciones externas también apuntan a un rendimiento alto en tareas de ciberseguridad.
El UK AI Security Institute informó que Claude Mythos Preview resolvió el 73% de los desafíos de seguridad tipo capture‑the‑flag (CTF) de nivel experto, una prueba habitual para medir habilidades reales de descubrimiento de vulnerabilidades.
Los análisis disponibles también describen otras capacidades destacadas:
Estas tareas normalmente requieren investigadores de seguridad muy especializados.
La mayoría de los hallazgos sigue bajo confidencialidad mientras se preparan parches. Aun así, algunos ejemplos se han mencionado públicamente.
Entre ellos:
Anthropic ha indicado que más del 99% de las vulnerabilidades descubiertas aún no han sido parcheadas públicamente, por lo que no pueden revelar detalles por ahora.
Project Glasswing funciona como una coalición de empresas tecnológicas, proveedores de infraestructura y organizaciones de seguridad.
Entre los participantes iniciales reportados se encuentran:
En total, el programa reúne alrededor de 50 organizaciones que ejecutan el modelo sobre su propio software y sobre infraestructuras críticas de código abierto.
Anthropic insiste en que Mythos Preview no está disponible públicamente por razones de seguridad.
Un sistema capaz de descubrir y explotar vulnerabilidades zero‑day de forma automatizada podría reducir drásticamente la barrera de entrada para ataques informáticos a gran escala.
La estrategia de la empresa es utilizar primero el modelo para parchear la mayor cantidad posible de fallos antes de que capacidades similares se vuelvan comunes.
A pesar de los números llamativos, parte de la comunidad de ciberseguridad ha planteado varias dudas.
1. Verificación independiente limitada
Muchos de los resultados provienen de informes de la propia Anthropic. Como la mayoría de las vulnerabilidades aún no se han divulgado, investigadores externos no pueden evaluarlas directamente.
2. Posible solapamiento con herramientas existentes
Algunos investigadores sostienen que combinaciones de modelos públicos y herramientas de análisis podrían lograr resultados similares, lo que implicaría que Mythos es más una aceleración tecnológica que una capacidad totalmente nueva.
3. Falta de estadísticas claras sobre validación en producción
Aunque existen métricas de benchmarks, todavía hay pocos datos públicos detallados sobre cuántos fallos detectados por la IA fueron confirmados y corregidos en sistemas reales.
Si las cifras reportadas se confirman con el tiempo, Project Glasswing podría convertirse en uno de los mayores esfuerzos de descubrimiento de vulnerabilidades asistido por IA jamás realizados. En su primer mes, el programa habría identificado más de 10.000 fallos críticos o de alta gravedad en software clave utilizado en todo el mundo.
Aun así, la falta de verificación independiente significa que la comunidad de seguridad todavía está evaluando hasta qué punto estos resultados representan un salto tecnológico único o simplemente el comienzo de una nueva generación de herramientas de análisis impulsadas por IA.
Comments
0 comments