운영자들과 독립 연구자들이 밝혀낸 조작 방식은 꽤나 체계적이다.
조작의 정도가 너무 심해지자, 레딧의 자원봉사 운영자들도 더 이상 묵과할 수 없는 지경에 이르렀다. 2026년 5월 말, r/biohackers 운영진은 펩타이드와 호르몬 대체 요법(HRT)에 관한 모든 신규 게시물을 전면 금지하는 초강수를 두었다 .
운영진은 명시적으로, 이번 금지 조치가 펩타이드의 과학적 위험성 때문이 아니라, LLM이 제공하는 정보를 조작하기 위해 해당 산업계의 기업들이 “조직적으로 커뮤니티 콘텐츠를 왜곡하려 한 시도” 때문이라고 밝혔다 . 마케터들이 AI 조작의 ‘사냥터’로 커뮤니티를 이용하면서 내부 신뢰는 완전히 무너져 내렸다.
싸움은 자원봉사 운영자들에게만 맡겨져 있지 않다. 레딧 경영진은 불법 데이터 스크래핑을 뿌리 뽑기 위해 다각도의 법적 공세에 나섰다.
레딧은 공식 계약을 맺은 파트너에게 데이터를 판매하는 데는 매우 적극적이지만, 허가되지 않은 데이터 수집 행위에는 무자비하게 대응하고 있다. 회사 측은 데이터 스크래핑 업체인 SerpApi, Oxylabs, AWMProxy를 두고 “데이터 은행 강도”이자 “데이터 세탁업자”라 비난하며, 이들이 산업적 규모로 불법적인 보호 장치 우회를 감행했다고 주장했다 .
특히, 법원 문서를 통해 밝혀진 한 가지 교묘한 함정 수사 작전은 큰 주목을 받았다. 레딧은 구글의 크롤러만 볼 수 있는 일종의 ‘미끼 게시물’을 심어두었는데, 이 게시물이 나중에 AI 검색 엔진 ‘펄플렉시티(Perplexity AI)’의 답변에 등장한 것이다. 레딧은 이것이 펄플렉시티가 데이터를 직접 라이선스한 것이 아니라 구글 검색 결과를 무단으로 긁어모았다는 증거라고 주장했다 . 이 사건은 2025년 10월, 뉴욕 남부 연방 지방법원에 제기된 고강도 소송으로 이어졌다
.
이러한 법적 싸움들은 “구글이나 오픈AI처럼 규칙을 지키는 회사들과는 잘 거래할 수 있지만, 그렇지 않은 세력에게는 디지털 법의학 수사까지 동원할 수 있다”라는 강력한 메시지를 업계에 보내기 위한 포석으로 풀이된다 .
레딧에서 발생한 이 펩타이드 스캔들은 AI 기반 검색의 미래에 대한 중대한 경고음이다. 이 사건은 모델의 신뢰성이 학습 데이터의 질을 절대 넘을 수 없다는 근본적인 취약점을 여지없이 드러냈다.
파장은 다른 커뮤니티로도 번지고 있다. 무려 690만 명의 개발자들이 모인 대형 커뮤니티 r/programming은 2026년 4월, AI나 LLM이 생성한 저품질 콘텐츠가 진지한 개발 논의를 압도하는 것을 막기 위해 한 달간 관련 게시물을 전면 금지하는 실험을 강행하기도 했다 .
일반 사용자들이 기억해야 할 핵심은 이것이다. AI 챗봇이 건강에 관한 조언을 하면서 출처로 “레딧 사용자”를 인용할 때, 그 ‘사용자’는 정교한 마케팅 봇일 수 있으며, 그것이 대표하는 ‘집단의 합의’는 이사회 회의실에서 제조된 것일 가능성이 높다는 점이다. 레딧이 라이선스 데이터에 설정한 안전장치는, 사용자 레벨에서 이루어지는 조직적인 콘텐츠 심기 공격을 막기에 충분하지 않다는 것이 증명되었다. 이는 현대 AI 웹의 근간을 이루는 데이터의 진정성 자체를 의심하게 만드는 위기다 .
Comments
0 comments