De ellas, 22 fueron calificadas como críticas y más de 100 alcanzaron severidad crítica o alta . La más peligrosa fue la CVE-2026-10881, un fallo de lectura y escritura fuera de límites en el motor gráfico ANGLE que obtuvo una puntuación CVSS de 9.6 y podría permitir un escape del sandbox mediante una página HTML maliciosa
. Muchos de los bugs críticos eran del tipo "use-after-free", un problema recurrente de seguridad de memoria en los navegadores
.
Los ingenieros de Google detectaron internamente alrededor de 371 de los fallos; el resto fue reportado por investigadores independientes, y la compañía pagó $209,000 en recompensas por errores . SecurityWeek señaló que el aumento de fallos en Chrome probablemente fue impulsado por el uso creciente de la IA en la caza de vulnerabilidades, un cambio que llevó a Google a reducir sus pagos de recompensas en abril de 2026
.
Según Google, ninguna de las vulnerabilidades estaba siendo explotada activamente en el momento de la divulgación . Sin embargo, la enorme escala del parche plantea una seria cuestión operativa: ¿pueden incluso los equipos de ingeniería con más recursos mantener el ritmo cuando el descubrimiento impulsado por IA inunda sus gestores de bugs?
Justo cuando aterrizaba Chrome 149, la startup de seguridad depthfirst publicó los resultados de su agente de IA en producción contra FFmpeg, la biblioteca multimedia de código abierto que sustenta el procesamiento de video en innumerables aplicaciones y dispositivos .
El agente escaneó aproximadamente 1.5 millones de líneas de código C y encontró 21 vulnerabilidades zero-day previamente desconocidas: bugs que nunca habían sido divulgados públicamente y que, en varios casos, habían pasado desapercibidos durante 15 a 20 años . La mayoría eran desbordamientos de pila (stack overflow) y montículo (heap overflow) en componentes que iban desde el demuxer de transporte de flujo (TS) hasta el decodificador VP9
.
Un detalle crucial es que el sistema de depthfirst hizo más que marcar código sospechoso. Produjo pruebas de concepto (PoC) concretas y reproducibles para cada error, confirmando sus hallazgos . El coste total de la ejecución: aproximadamente $1,000
.
A modo de comparación, el modelo Mythos de Anthropic había extraído previamente un fallo de 16 años de antigüedad en el códec H.264 de FFmpeg por unos $10,000 . Depthfirst presentó su resultado como un logro de resultados equiparables a una décima parte del coste
. Las implicaciones son contundentes: el sofisticado descubrimiento de zero-days, antes reservado a laboratorios de investigación bien financiados y estados-nación, se está acercando al coste de una factura de computación en la nube que casi cualquiera podría pagar.
Las historias de Chrome y FFmpeg no son hechos aislados. Se sitúan dentro de un patrón más amplio que se ha acelerado a lo largo de 2025 y 2026.
El agente Big Sleep de Project Zero de Google encontró el primer zero-day en producción descubierto por IA —un desbordamiento insuficiente del búfer de pila en SQLite— en noviembre de 2024 . Desde entonces, el ritmo se ha acelerado. El análisis estático asistido por IA de ZeroPath encontró siete fallos en FFmpeg a finales de 2025
. El modelo Mythos de Anthropic descubrió más tarde vulnerabilidades en OpenBSD, FreeBSD, Linux, Firefox y bibliotecas criptográficas, muchas de las cuales llevaban entre 16 y 27 años en el código
. Para abril de 2026, Mythos había logrado escribir exploits contra Firefox en 181 ocasiones, una mejora de 90 veces respecto a la generación anterior de modelos
.
El propio parche de Chrome 149 fue un reflejo directo de esta nueva velocidad. Los 429 parches anunciados en junio de 2026 ya habían superado el número total de parches de seguridad de Chrome lanzados en todo 2025, según informó SecurityWeek .
Encontrar bugs es rápido. Corregirlos sigue siendo un proceso humano. Chrome 149 demuestra que incluso Google, con sus enormes recursos de ingeniería y un programa maduro de gestión de vulnerabilidades, puede enfrentarse a una acumulación enorme de bugs . Para los mantenedores de proyectos de código abierto más pequeños, la situación es más precaria. El reducido equipo central de FFmpeg ahora debe clasificar, validar y desarrollar parches para vulnerabilidades entregadas en masa por múltiples herramientas de IA, no solo depthfirst, sino también Big Sleep de Google, Mythos de Anthropic y otros
. El proyecto FFmpeg ya ha rechazado lo que considera informes de errores de baja calidad generados por IA, calificando algunos envíos de Google de "basura CVE" (CVE slop) cuando los hallazgos involucraban código esotérico para videojuegos de hace 30 años
.
Un defensor con buenos recursos ahora puede ejecutar múltiples modelos de IA contra su propio código antes de lanzar un producto, y muchos lo están haciendo. Pero la misma economía se aplica a cualquiera. Un estudio de la UIUC (Universidad de Illinois en Urbana-Champaign) estimó el coste promedio de explotación asistida por IA en $8.80 por vulnerabilidad usando GPT-4, frente a un estimado de $25 por vulnerabilidad para un investigador humano cualificado . La ejecución de $1,000 de depthfirst en FFmpeg redujo el coste por zero-day a aproximadamente $48, y es probable que las mejoras posteriores en hardware y modelos lo reduzcan aún más
.
Los defensores aún se enfrentan a un proceso manual de parcheo y despliegue que consume mucho tiempo. La asimetría crece.
La rápida mercantilización del descubrimiento de vulnerabilidades impulsado por IA exige una respuesta práctica en lugar de pánico. Los equipos de seguridad deben asumir que los actores de amenazas, estatales y no estatales por igual, ya están ejecutando estos modelos contra el software del que dependen sus organizaciones.
Los pasos prácticos incluyen ejecutar agentes de seguridad de IA contra tu propio código fuente primero, ya que la mejor defensa es encontrar y corregir los errores graves antes de que lo hagan los atacantes. Reducir la latencia de los parches es igualmente crítico; la brecha entre la divulgación pública y el despliegue del parche se ha convertido en la ventana más peligrosa en la era de la IA, por lo que hay que priorizar el escaneo de la cadena de suministro de software y aplicar las actualizaciones el mismo día que se publican. Tratar la divulgación de vulnerabilidades como un problema de sobrecarga también es esencial: la mayoría de los equipos carecen de la capacidad para clasificar una avalancha repentina de informes generados por IA, lo que significa que construir o adoptar canales de validación automatizados que puedan filtrar la señal del ruido será pronto un requisito previo para mantener un software seguro.
El megaparche de Chrome 149 y la campaña de $1,000 de depthfirst en FFmpeg no son anomalías. Son señales de un nuevo camino. Los modelos de IA ahora encuentran bugs que sobrevivieron a décadas de revisión humana y millones de pruebas automatizadas de fuzzing, de forma barata y a gran escala. Como señaló una nota de investigación de la Cloud Security Alliance, incluso los modelos de IA que no son de vanguardia ya pueden encontrar zero-days .
El cuello de botella ya no es el descubrimiento. Es todo lo que viene después. Hasta que la parte de la ecuación dedicada a la solución se ponga al día —mediante una mejor automatización, canales de despliegue más rápidos o nuevos enfoques arquitectónicos para la seguridad del software—, cada parche que bate récords y cada ejecución de descubrimiento ultrabarata será una advertencia que la industria no puede permitirse ignorar.
Comments
0 comments