조사와 사용자 보고를 보면 AI 시스템이 민감한 연락처 정보를 노출하는 방식은 몇 가지 유형으로 나뉜다.
대형 언어 모델은 웹 문서, 아카이브, 정부 기록 등 방대한 데이터를 학습한다. 이 자료들 중 일부에는 실제 전화번호나 주소가 포함돼 있다. 특정 질문을 받았을 때 챗봇이 이런 정보를 그대로 재생산하는 경우가 보고됐다 .
아직 대규모 통계는 많지 않지만, 여러 사건이 이미 보고되고 있다.
“AI가 당신 번호를 줬다”는 전화: 어떤 피해자는 낯선 사람들이 전화해 "챗봇이 이 번호를 서비스 연락처라고 알려줬다"고 말하며 연락해왔다고 밝혔다 .
원치 않는 상담 전화 폭주: 법률 상담이나 열쇠공 서비스를 찾던 사람들이 챗봇에서 얻은 번호로 전화를 걸어, 전혀 관련 없는 개인에게 전화가 몰린 사례도 보고됐다 .
개발자에게 쏟아진 고객 문의 전화: 한 이스라엘 소프트웨어 개발자는 AI가 그의 개인 번호를 서비스 연락처로 제시한 뒤부터 고객 문의 전화를 계속 받게 됐다 .
연구자가 개인 연락처 추출: 대학 연구진 실험에서 챗봇을 이용해 동료의 휴대전화 번호나 교수의 집 주소를 찾아낼 수 있었다는 사례도 있다 .
집 주소 노출 사례: 일부 조사에서는 AI가 이름만 입력해도 일반인의 주거 주소를 응답으로 제공한 경우도 보고됐다 .
이러한 사건들은 단순한 오류가 실제 생활의 피해로 이어질 수 있다는 점을 보여준다.
AI 등장 이전에는 많은 개인 정보가 ‘실질적 익명성(practical obscurity)’ 상태에 있었다.
즉, 이론적으로는 공개돼 있지만 찾으려면 많은 시간과 노력이 필요했다.
예를 들어 주소나 전화번호를 찾으려면 여러 정부 데이터베이스나 오래된 웹 페이지를 직접 뒤져야 했다.
이 때문에 일부 전문가들은 AI 시스템이 사실상 자동화된 데이터 브로커처럼 작동할 수 있다고 우려한다.
AI 도싱 문제는 기술적으로 간단히 해결하기 어렵다.
대형 언어 모델은 정보를 표 형태로 저장하지 않는다. 대신 통계적 패턴으로 학습하기 때문에 특정 데이터를 정확히 삭제하거나 수정하기가 쉽지 않다.
프라이버시 전문가와 AI 개발자들은 몇 가지 대응 방법을 모색하고 있다.
다만 AI 모델의 구조와 데이터 규모 때문에 위험을 완전히 제거하는 것은 쉽지 않다는 것이 현재 전문가들의 공통된 평가다.
AI 도싱 논란은 단순한 기술 오류 이상의 문제를 보여준다.
생성형 AI는 기존에 존재하던 정보를 훨씬 더 빠르고 쉽게 찾아낼 수 있게 만든다. 데이터가 비밀이 아니었더라도, AI의 자동화된 검색과 대화형 인터페이스가 그 영향을 크게 확대할 수 있다.
Comments
0 comments