Investigadores de seguridad reconocieron esto de inmediato como un clásico problema del agente confundido: el agente de IA estaba autorizado para ejecutar operaciones sensibles en la cuenta a través de las APIs internas, pero carecía de la lógica fundamental para confirmar la identidad del individuo que daba la orden . Como lo expresó un análisis, a la IA se le "dio permiso para hacer cambios en la cuenta sin enseñarle cómo confirmar la identidad del solicitante"
.
El método de ataque era brutalmente simple. El exploit se documentó por primera vez en un video que circuló en Telegram el 31 de mayo de 2026, y no implicaba más que una conversación por chat con el propio asistente de soporte de IA de Meta . Así es como funcionaba:
Esta cadena de ataque tuvo éxito contra cualquier cuenta que no tuviera habilitada la autenticación de dos factores (2FA). Los propios atacantes que compartieron el video del exploit confirmaron explícitamente que su método fallaba contra cuentas con cualquier forma de MFA activada .
La escala y el perfil de las víctimas subrayaron lo lucrativo que se había vuelto el robo de cuentas de Instagram. De las 20,225 cuentas secuestradas, los objetivos más visibles incluyeron:
@hey y @korn— porque alcanzan precios de reventa de miles a cientos de miles de dólares en foros clandestinos Investigadores estimaron que el valor colectivo de las cuentas premium robadas y puestas a la venta en Telegram superaba el millón de dólares, aunque Meta no ha confirmado esta cifra . Varias cuentas secuestradas fueron desfiguradas brevemente con imágenes proiraníes antes de ser bloqueadas, añadiendo un matiz geopolítico al incidente
.
La ventana de vulnerabilidad se extendió desde al menos el 17 de abril hasta el 31 de mayo de 2026—más de seis semanas de explotación activa antes de que el equipo de seguridad de Meta identificara y parcheara la falla .
El cronograma de respuesta de Meta fue rápido una vez que el exploit se hizo público, aunque se vio empañado por una confusión inicial:
Es importante distinguir este incidente de una vulnerabilidad separada pero concurrente descubierta el 8 de junio de 2026, donde un fallo en el flujo de restablecimiento de contraseña web de Instagram expuso las direcciones de correo electrónico y números de teléfono sin enmascarar de todos los usuarios de Instagram . Ese error no estaba relacionado con el fallo lógico del chatbot de IA, pero ambos surgieron en el mismo ciclo de noticias, creando confusión inicial sobre el alcance de cada problema.
Si hay una lección procesable única de esta brecha, es el poder decisivo de la autenticación multifactor. Incluso la forma más débil —los códigos de un solo uso por SMS— funcionó como un muro infranqueable. Los propios atacantes difundieron esta información, advirtiendo que su técnica solo funcionaba en cuentas sin ninguna forma de MFA activada . El exploit de restablecimiento de contraseña permitía iniciar sesión únicamente con una contraseña; cuando se requería un segundo factor, los atacantes quedaban bloqueados
.
Para cualquier persona que posea una cuenta de Instagram de alto valor —una marca, figura pública o propietario de un nombre de usuario corto—, habilitar MFA, idealmente con una llave de seguridad de hardware o passkey, sigue siendo la medida de seguridad más efectiva contra este tipo de ataque.
El incidente de High Touch Support es una advertencia para el despliegue rápido de agentes de IA autónomos en flujos de trabajo orientados al cliente. La IA era capaz, seguía instrucciones y estaba conectada a potentes sistemas internos. Pero se desplegó sin una autenticación determinista fuera de banda para acciones sensibles, un requisito de seguridad fundamental que los agentes humanos siguen de forma rutinaria. A medida que las organizaciones se apresuran a integrar asistentes de soporte de IA en sistemas de pago, gestión de cuentas y acceso a datos confidenciales, el caso de Meta sirve como un recordatorio de que el acceso sin verificación no es automatización; es una puerta abierta.
Nota de corrección: Una versión anterior de este artículo afirmaba que los atacantes eludieron 2FA. El exploit solo funcionó contra cuentas sin MFA habilitada; el restablecimiento de contraseña dio a los atacantes una nueva contraseña, pero cualquier segundo factor activo bloqueaba el inicio de sesión .
Comments
0 comments