Debido a que ChatGPT no verifica adecuadamente el contenido Markdown de las páginas web antes de mostrarlo, cualquier página que el modelo explore se convierte en un potencial vector de ataque. No se trata de una vulnerabilidad en los servidores de OpenAI, sino de una debilidad en cómo se muestra la información en el navegador del usuario, abusando de la confianza que depositamos en lo que vemos en la interfaz de ChatGPT.
ChatGPhish no surgió de la nada. Es el capítulo más reciente de una escalada de técnicas de inyección de prompts que han acompañado cada nueva funcionalidad de ChatGPT. Cada vez que el modelo aprendió a navegar por internet, ejecutar código o recordar información, los atacantes encontraron nuevas superficies para inyectar instrucciones y robar datos.
Estos son los hitos clave que llevaron a ChatGPhish:
Cada paso en esta línea de tiempo sigue un mismo patrón: una nueva funcionalidad abre una nueva puerta de entrada a los atacantes, y el renderizador de Markdown demuestra ser, una y otra vez, el eslabón más débil al confiar ciegamente en el contenido externo.
Hasta el 29 y 30 de mayo de 2026, la información disponible documenta la revelación pública de ChatGPhish por parte de Permiso Security, pero no se ha reportado ningún comunicado oficial ni parche de OpenAI específico para esta vulnerabilidad .
Cabe mencionar que OpenAI no estuvo inactivo en materia de seguridad durante esas fechas. La empresa gestionó dos incidentes distintos, no relacionados con ChatGPhish:
La falta de una respuesta ante ChatGPhish es significativa. La función de resumen web queda expuesta, y ahora que el fallo es de dominio público, el riesgo de que se use activamente para lanzar ataques de phishing es mayor.
ChatGPhish es un problema grave porque ataca la confianza, un pilar fundamental para que los asistentes de IA sean útiles. Cuando ChatGPT resume una página y presenta enlaces en su interfaz, el usuario no tiene ninguna señal visual que le indique que esos enlaces provienen de un tercero no confiable y no de OpenAI.
Las empresas que permiten a sus empleados usar la función de navegación de ChatGPT deberían, mientras no haya una solución oficial, tratar los resúmenes web como una fuente de contenido potencialmente peligrosa. Esta vulnerabilidad también pone de relieve una tensión en el diseño de estos sistemas: los asistentes de IA que combinan su propia interfaz con datos de terceros necesitan renderizadores que traten todo el contenido externo como una potencial amenaza, y no como un simple texto para mostrar.
Comments
0 comments