ОтветыОпубликовано2 месяца назадLast edited в прошлом месяце20 источники

AI‑доксинг: когда чат‑боты случайно выдают реальные номера телефонов и домашние адреса

AI‑доксинг — это ситуация, когда чат‑боты случайно раскрывают личные данные людей, например реальные номера телефонов или домашние адреса, извлечённые из публичных записей, обучающих данных или интернет‑источников [2]... В некоторых случаях люди начинают получать звонки от незнакомцев, которые говорят, что нашли ном...

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

Illustration representing AI chatbots exposing personal phone numbers and addresses — What is “AI doxxing,” how are chatbots like ChatGPT, Gemini, Perplexity, Grok, and WhatsApp AI exposing real people’s phone numbers and homeAI assistants can sometimes surface real phone numbers or addresses from public records or training data, creating a privacy risk known as “AI doxxing.”
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: What is “AI doxxing,” how are chatbots like ChatGPT, Gemini, Perplexity, Grok, and WhatsApp AI exposing real people’s phone numbers and home. Article summary: AI doxxing is the use of AI systems to reveal or assemble personally identifying information—especially phone numbers, home addresses, or other contact details—about real people who did not consent [2][3][5]. The concern. Topic tags: general, education, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "## Known as ‘AI doxxing’, victims say popular chatbots are sharing their personal phone numbers with strangers. The one thing the strangers had in common was that they had found th" source context "'AI gave me your number': AI doxxing turning ChatGPT ..." Reference image 2: visual subject "## Known as
openai.com

Генеративные ИИ‑чат‑боты умеют быстро отвечать на вопросы и собирать информацию из огромных массивов данных. Но эта способность породила новую проблему приватности, которую всё чаще называют «AI‑доксингом».

Под этим термином понимают ситуацию, когда система искусственного интеллекта раскрывает или собирает личную идентифицирующую информацию о реальном человеке — например номер телефона или домашний адрес — без его согласия. По данным журналистских расследований и исследований, некоторые чат‑боты могут выдавать такие сведения, извлекая их из публичных записей, обучающих наборов данных или разрозненных источников в интернете .

Результат — информация, которая раньше была «технически публичной», но труднонаходимой, становится доступной мгновенно в одном ответе. Это может приводить к преследованию, мошенничеству или навязчивым звонкам.

Что означает «AI‑доксинг»

Традиционно доксинг — это намеренная публикация личных данных человека в интернете с целью давления, травли или запугивания.

С появлением ИИ процесс может происходить автоматически. Вместо долгого поиска по базам данных пользователь просто задаёт чат‑боту вопрос на обычном языке — например, кто живёт по конкретному адресу или как связаться с человеком или компанией.

В некоторых тестах чат‑боты отвечали реальными телефонными номерами или домашними адресами, связанными с частными лицами .

Важно, что модель не обязательно «хранит» эти данные напрямую. Она может:

воспроизвести их из обучающих данных
собрать из нескольких публичных источников
извлечь из архивных документов или старых справочников

Когда система объединяет такие фрагменты в один ответ, поиск личных данных становится намного проще, чем при обычном веб‑поиске .

Как чат‑боты могут раскрывать личные данные

Расследования и эксперименты исследователей показывают несколько основных механизмов.

1. Личные данные в обучающих наборах

Большие языковые модели обучаются на огромных массивах текста — веб‑страницах, документах и архивных данных. Некоторые из этих источников содержат контактную информацию людей. В отдельных случаях модели воспроизводили телефонные номера или адреса, встречавшиеся в таких материалах .

2. Сбор данных из публичных записей

Даже если информация формально открыта — например в земельных реестрах или государственных документах — раньше её было трудно найти. Чат‑бот может быстро собрать её из разных источников и выдать готовый ответ .

3. Галлюцинации и ошибки

Иногда модель не извлекает реальные данные, а ошибочно придумывает или приписывает номер телефона. Проблема в том, что такой номер может принадлежать настоящему человеку — и его начинают беспокоить звонками .

4. Цепочки уточняющих запросов

Исследователи также показали, что последовательные уточняющие запросы иногда позволяют обойти фильтры безопасности и постепенно получить чувствительную информацию .

Реальные случаи, когда это уже привело к проблемам

Хотя масштаб проблемы пока трудно измерить, уже есть несколько задокументированных случаев.

Нежелательные звонки незнакомцев. Некоторые люди сообщали, что им начали звонить незнакомые люди, которые утверждали, что нашли номер через чат‑бот, когда искали контакты юриста или мастера‑слесаря .

«ИИ дал мне ваш номер». Один из пострадавших рассказал, что регулярно получал звонки от людей, уверенных, что чат‑бот выдал его номер как контакт для различных услуг .

Ошибочный номер службы поддержки. Сообщалось о случае, когда израильский разработчик начал получать звонки от клиентов, потому что ИИ указал его личный номер как номер службы поддержки .

Эксперименты исследователей. Учёные университетов показали, что с помощью определённых запросов можно извлечь из чат‑бота номер телефона коллеги или домашний адрес преподавателя .

Раскрытие домашних адресов. В некоторых расследованиях сообщалось, что чат‑боты могли выдавать точные адреса проживания людей по запросу с их именем .

Эти случаи показывают, что даже случайные утечки могут быстро превращаться в реальные проблемы для людей.

Почему «практически скрытые» данные становятся опасными

До появления ИИ большая часть личной информации находилась в состоянии так называемой «практической скрытости».

Формально она могла быть публичной — например в архиве муниципальных документов — но найти её было сложно и требовало времени.

ИИ‑ассистенты резко уменьшают этот барьер. Один вопрос на естественном языке может заменить долгий поиск по нескольким базам данных и сайтам .

Поэтому некоторые исследователи считают, что чат‑боты начинают фактически выполнять роль автоматических брокеров данных, делая персональную информацию гораздо более доступной.

Почему проблему сложно исправить

Полностью устранить риск AI‑доксинга технически непросто.

Данные разбросаны по множеству источников

Телефон или адрес могут встречаться одновременно в веб‑архивах, государственных документах, справочниках и обучающих наборах данных. Удаление одного источника не гарантирует исчезновение информации .

Модели не работают как базы данных

Языковые модели кодируют статистические закономерности текста, а не хранят записи в таблицах. Поэтому удалить конкретную строку данных после обучения намного сложнее.

Фильтры безопасности несовершенны

Разработчики вводят ограничения на выдачу личных данных. Но исследования показывают, что результат может зависеть от формулировки запроса или контекста .

Пользователям трудно понять свои права

Исследователи отмечают, что политика конфиденциальности ИИ‑сервисов часто сложна и непонятна, поэтому людям трудно узнать, как используются их данные и как запросить их удаление .

Как пытаются снизить риски

Эксперты по приватности и разработчики предлагают несколько направлений решения проблемы.

Минимизация данных при обучении. Компании могут исключать источники, содержащие персональные контактные данные, если это возможно .

Тестирование на утечки. Системы проверяют с помощью специальных «провокационных» запросов, чтобы выявлять потенциальные сценарии доксинга .

Блокировка чувствительных ответов. Некоторые чат‑боты уже отказываются выдавать личные номера телефонов или домашние адреса даже если они есть в публичных источниках .

Быстрые процедуры жалоб. Эксперты предлагают создавать понятные механизмы для людей, чьи данные появляются в ответах ИИ .

Более широкая проблема приватности

AI‑доксинг показывает более общий эффект генеративного ИИ: технологии могут резко облегчить поиск информации, которая раньше была трудно доступна.

Это не всегда означает, что данные были секретными. Но скорость, автоматизация и разговорный интерфейс ИИ делают последствия раскрытия личных данных намного сильнее.

По мере того как чат‑боты становятся частью поисковых систем, мессенджеров и повседневных цифровых сервисов, исследователи предупреждают: без более жёстких правил конфиденциальности и улучшенных защитных механизмов риск случайного раскрытия персональных данных будет сохраняться .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «AI‑доксинг: когда чат‑боты случайно выдают реальные номера телефонов и домашние адреса»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Проблему трудно устранить: личные данные могут быть разбросаны по архивам интернета, государственным документам и обучающим датасетам, а языковые модели не хранят информацию как обычные базы данных [3][5][7].

Источники

← Back to Trending