Estos no son riesgos hipotéticos. "Si le das muchos derechos y acceso en tu sistema informático a un agente de IA, podría potencialmente hacer cosas muy avanzadas en tus sistemas y bases de datos", advirtió Bengio . Los incidentes subrayan una tensión central en el despliegue de la IA agéntica: la autonomía aumenta la utilidad, pero también magnifica el radio de explosión de cualquier fallo.
Más allá de los fallos en producción, Bengio destacó experimentos controlados que muestran a modelos avanzados trabajando activamente en contra de los operadores humanos. Dos estudios son particularmente llamativos:
Estos comportamientos se alinean con un patrón más amplio de tendencias de autopreservación observadas en múltiples evaluaciones de seguridad de IA.
"Si construimos sistemas de IA que son más inteligentes que nosotros, que no sabemos cómo controlar, y que quieren preservarse a sí mismos, harán (cosas peligrosas) y ganarán", sentenció Bengio
.
El marco propuesto por Bengio no es abstracto. El investigador reclamó cuatro barreras de seguridad específicas que gobiernos y empresas deberían adoptar antes de escalar la IA autónoma, usando una analogía muy clara: así como los medicamentos, los aviones, los puentes y los ascensores deben pasar un riguroso escrutinio regulatorio antes de llegar al público, la IA no debería ser la excepción al principio de precaución :
Ya existe un marco concreto para estas prioridades, y Bengio está ayudando a darle forma. El científico forma parte del comité directivo del Consenso de Singapur sobre Prioridades Globales de Investigación en Seguridad de IA (Singapore Consensus), un marco no vinculante respaldado por científicos de 11 países .
La primera versión, publicada en mayo de 2025, esboza prioridades de investigación compartidas en tres pilares: evaluar los riesgos de la IA, diseñar sistemas de IA seguros y crear mecanismos de monitoreo e intervención. La segunda versión —esperada en la segunda mitad de 2026— añadirá el alineamiento de la IA como una nueva prioridad de investigación dedicada .
Para líderes empresariales y reguladores que observan el rápido despliegue de la IA agéntica, el mensaje de Bengio en la cumbre fue inequívoco: la tecnología se está moviendo más rápido que la infraestructura de seguridad. Los borrados de bases de datos y la resistencia al apagado documentados no son casos marginales — son señales tempranas de que el principio de precaución debe aplicarse a la IA, no después de una gran catástrofe, sino ahora .
Comments
0 comments