Esto no significa necesariamente que el modelo "sepa" datos privados de forma directa. Con frecuencia lo que ocurre es que el sistema reconstruye o recupera información a partir de:
Cuando la IA reúne esas piezas en una sola respuesta, puede exponer detalles personales con mucha más facilidad que los métodos tradicionales de búsqueda .
Investigaciones y pruebas realizadas por periodistas y académicos han identificado varias formas en que estos sistemas pueden terminar mostrando información sensible.
Los modelos de lenguaje se entrenan con enormes volúmenes de datos que pueden incluir páginas web, documentos archivados o registros públicos. Algunos de esos materiales contienen números de teléfono o direcciones. En ciertos casos, los chatbots han reproducido esa información cuando reciben determinadas preguntas .
Incluso cuando los datos son técnicamente públicos, la IA puede agregarlos rápidamente. En lugar de revisar varios portales gubernamentales o bases de datos inmobiliarias, el chatbot puede mostrar la información directamente en una sola respuesta .
No todos los casos implican recuperar datos reales. A veces el modelo inventa o atribuye incorrectamente un número de teléfono, por ejemplo asignando el número de una persona real como contacto de una empresa o servicio .
Investigadores han demostrado que refinar las preguntas paso a paso puede llevar a que algunos sistemas revelen información que los filtros iniciales intentarían bloquear .
Aunque todavía hay pocos estudios sistemáticos, varios incidentes reportados ilustran cómo el AI doxxing puede afectar a personas reales.
• Llamadas de desconocidos tras obtener números en un chatbot: algunas personas han reportado recibir llamadas de extraños que dicen haber encontrado su número en una respuesta de IA mientras buscaban servicios como abogados o cerrajeros .
• “La IA me dio tu número”: un afectado contó que varios llamadores insistían en que un chatbot les había proporcionado su teléfono como contacto para servicios que él no ofrecía, provocando llamadas constantes no deseadas .
• Un desarrollador que empezó a recibir llamadas de soporte técnico: en un caso reportado, un programador israelí comenzó a recibir solicitudes de ayuda porque un chatbot había publicado su número personal como si fuera el de un servicio de atención al cliente .
• Investigadores extrayendo datos personales: estudiantes de doctorado de la Universidad de Washington lograron obtener el número de móvil de un colega y la dirección de casa de un profesor mediante prompts dirigidos a un chatbot .
• Direcciones residenciales expuestas: investigaciones también han señalado casos en los que sistemas de IA respondieron con direcciones de domicilio cuando se les preguntó por determinadas personas .
Estos ejemplos muestran que incluso errores accidentales pueden tener consecuencias reales, desde acoso hasta riesgos de seguridad personal.
Antes de la aparición de asistentes de IA, gran parte de la información personal existía en lo que algunos investigadores llaman “oscuridad práctica” (practical obscurity). Era técnicamente pública, pero requería esfuerzo encontrarla.
Por ejemplo, alguien podía necesitar revisar múltiples registros gubernamentales o páginas archivadas para localizar un teléfono o dirección.
Los chatbots cambian esa dinámica porque convierten preguntas en lenguaje natural en búsquedas y resúmenes automáticos. Como resultado, datos antes ocultos entre registros pueden aparecer en segundos en una conversación .
Esto ha llevado a algunos expertos a advertir que los asistentes de IA podrían actuar, en la práctica, como intermediarios automatizados de datos, facilitando el acceso masivo a información sensible.
Eliminar datos personales de sistemas de IA es técnicamente complicado por varias razones.
Un número de teléfono o una dirección pueden aparecer en archivos web, documentos gubernamentales, directorios antiguos o múltiples conjuntos de entrenamiento. Eliminar una sola fuente no garantiza que el modelo deje de generar información similar .
Los modelos de lenguaje no guardan registros individuales en tablas. En cambio, aprenden patrones estadísticos durante el entrenamiento, lo que hace más difícil eliminar información específica una vez incorporada.
Las empresas suelen añadir barreras para bloquear solicitudes de datos personales, pero investigaciones muestran que su eficacia puede variar según cómo se formule la pregunta o el contexto de la conversación .
Algunos estudios señalan que las políticas de privacidad de los sistemas de IA son difíciles de entender para los usuarios, lo que complica saber cómo se utilizan los datos o cómo solicitar su eliminación .
Ante estos riesgos, expertos en privacidad y desarrolladores de IA están explorando varias medidas.
Minimización de datos en el entrenamiento: algunos investigadores proponen excluir, cuando sea posible, fuentes que contengan información de contacto personal .
Mejor filtrado y pruebas de seguridad: los sistemas pueden someterse a pruebas diseñadas específicamente para detectar comportamientos de doxxing antes de su lanzamiento .
Bloqueo de salidas sensibles: ciertos chatbots se niegan a proporcionar números de teléfono personales o direcciones residenciales, incluso si esos datos existen en registros públicos .
Canales rápidos para denuncias y eliminación: expertos recomiendan que las empresas ofrezcan procesos claros para que las personas afectadas soliciten la retirada de su información .
Aun así, debido al tamaño de los conjuntos de entrenamiento y a la complejidad de los modelos, eliminar por completo el riesgo sigue siendo un desafío.
El fenómeno del AI doxxing refleja un cambio más amplio: la inteligencia artificial puede hacer que información antes difícil de encontrar sea accesible al instante.
Eso no significa necesariamente que los datos fueran secretos. Pero la velocidad, automatización y facilidad de uso de los chatbots amplifican el impacto cuando aparece información personal.
A medida que los asistentes de IA se integran en buscadores, aplicaciones de mensajería y herramientas cotidianas, investigadores advierten que probablemente harán falta reglas de privacidad más claras y salvaguardas técnicas más fuertes para evitar la exposición accidental de datos sensibles .
Comments
0 comments