AI는 헤드라인이나 초록이 아닌 전체 출처를 읽고, 해당 출처가 주장을 직접 지지하는지, 반박하는지, 관련이 없는지 확인합니다. 왜곡 인용, 선별적 인용, 맥락 생략 등을 찾아냅니다 . 시스템은 이름이 명시된 출처의 1차 데이터를 인용하고, 다른 신뢰할 수 있는 사이트와 링크를 주고받는 콘텐츠를 선호합니다
. 익명의 저자가 이름 없는 '업계 전문가'를 인용하며 외부 참조가 없는 콘텐츠는 사실상 검증이 불가능하므로 인용될 가능성이 낮습니다
.
자동 팩트체킹 시스템은 여러 독립 출처를 교차 참조해 주장을 확인합니다. 여러 권위 있는 출처가 주장을 뒷받침하면 인용될 가능성이 높아집니다. 출처 간 모순이 발생하면 시스템은 신뢰도를 낮출 수 있습니다 . 이는 절대적인 의미의 '옳음'이 아니라, AI가 신뢰할 만하다고 간주하는 출처들 사이의 합의에 관한 문제입니다
. 시스템은 출처 간 중복, 일관성, 일치 여부를 확인하며, 동일한 아이디어가 다른 곳에서 비슷한 형태로 나타나는지 검사합니다
.
시스템은 모든 후보 페이지에 동일한 다섯 가지 검사를 적용합니다: 페이지에 도달하고, 읽고, 명확한 답을 추출하고, 해당 주제에 대해 출처가 신뢰할 만한지 판단하고, 주장을 검증할 수 있을 만큼 구체적인지 확인하며, 질문에 맞게 충분히 최신인지 확인합니다 . 페이지는 일반적인 주제뿐만 아니라 특정 질문과 밀접하게 일치해야 합니다
. 하나의 명확한 개념에 초점을 맞춘 콘텐츠는 광범위하거나 혼합 주제의 페이지보다 AI가 검색하고 재사용하기 쉽습니다
. 모든 검사를 통과한 페이지만 인용되고, 하나라도 실패하면 검색은 되었지만 조용히 제외됩니다
.
시스템이 올바른 문서를 확보하면, 이를 사용해 응답을 '그라운딩'합니다. 즉, 훈련 데이터에만 의존하지 않고 검색된 콘텐츠를 기반으로 답변을 생성합니다. 이 그라운딩 단계는 뒷받침되지 않는 주장과 할루시네이션(환각)을 줄이는 것을 목표로 합니다 .
이러한 모든 검사에도 불구하고, AI 검색 엔진의 출처 인용 정확도는 완벽과는 거리가 멉니다. 컬럼비아 저널리즘 리뷰(Columbia Journalism Review)의 연구는 8개의 AI 검색 엔진을 테스트한 결과, 약 60%의 놀라운 비율로 잘못된 출처를 인용한다는 사실을 발견했습니다 . 엔진은 때때로 인용을 완전히 조작하거나 출처의 관련 없는 부분에서 사실을 가져오기도 합니다. 한 업계 분석가의 표현처럼, 검증 메커니즘은 '어느 것 하나 완벽하지 않습니다'
.
이 파이프라인을 이해하면 일부 출처가 인용되고 다른 출처는 그렇지 않은 이유를 설명하는 데 도움이 됩니다. 시스템은 참신함보다 합의를, 익명성보다 권위를, 편의성보다 검증 가능성을 우선시합니다. 그러나 높은 오류율은 사용자가 특히 뉴스, 통계, 시의성이 중요한 정보의 경우 AI가 인용한 주장을 원본 출처와 대조해 직접 확인해야 함을 의미합니다. AI는 정보를 빠르게 찾을 수 있지만, 그 정보를 반복해도 안전한지 판단하는 것이 어려운 부분입니다 .
Comments
0 comments