Kịch bản bị các quản trị viên tình nguyện và các nhà nghiên cứu độc lập vạch trần bao gồm nhiều bước phối hợp nhịp nhàng:
Sự thao túng cuối cùng đã trở nên quá lộ liễu đến mức các quản trị viên tình nguyện của Reddit không thể làm ngơ. Cuối tháng 5/2026, các quản trị viên của r/biohackers đã đưa ra một quyết định cứng rắn: cấm tất cả các bài đăng độc lập mới về peptide và liệu pháp thay thế hormone (HRT) .
Các quản trị viên tuyên bố rõ ràng rằng lệnh cấm không phải vì khoa học về peptide nguy hiểm, mà là do "nỗ lực có phối hợp từ các công ty trong các ngành đó nhằm thao túng nội dung của cộng đồng" để gây ảnh hưởng đến những gì mà các LLM nói ra . Niềm tin trong cộng đồng đã bị phá vỡ bởi những kẻ tiếp thị coi subreddit này như một sân tập để thao túng AI.
Cuộc chiến không chỉ dừng lại ở những quản trị viên tình nguyện. Ban lãnh đạo Reddit đã phát động một chiến dịch pháp lý đa mũi nhọn để bảo vệ hệ sinh thái dữ liệu của mình khỏi nạn thu thập dữ liệu trái phép - hành vi tiếp tay cho các vòng lặp thao túng này.
Trong khi Reddit sẵn sàng bán dữ liệu cho các đối tác, họ lại cực kỳ cứng rắn với những kẻ thu thập dữ liệu chui. Công ty đã ví các công ty thu thập dữ liệu SerpApi, Oxylabs, và AWMProxy như những "tên cướp ngân hàng" và "kẻ rửa dữ liệu", cáo buộc họ đã "lách luật phi pháp ở quy mô công nghiệp" các biện pháp bảo vệ để bán lại nội dung của Reddit cho bên thứ ba .
Trong một chiến dịch gài bẫy đặc biệt tinh ranh được ghi lại trong hồ sơ tòa án, Reddit đã cài một bài đăng "bẫy" chỉ hiển thị với trình thu thập dữ liệu của Google. Bài đăng này sau đó đã xuất hiện trong "công cụ trả lời" của Perplexity AI – qua đó, Reddit cáo buộc, chứng minh rằng Perplexity đã thu thập nội dung từ kết quả tìm kiếm của Google thay vì xin cấp phép trực tiếp . Điều này đã dẫn đến một vụ kiện có mức cược rất cao được đệ trình vào tháng 10 năm 2025 tại Quận phía Nam của New York
. Reddit cũng đã kiện Anthropic, nhà sản xuất mô hình AI Claude, vì cáo buộc đã huấn luyện trên dữ liệu của người dùng mà không được phép
.
Những vụ kiện này là một phần của chiến lược lớn hơn nhằm phát đi tín hiệu rằng, trong khi Reddit sẵn sàng hợp tác về các thỏa thuận dữ liệu – như với Google và OpenAI – thì những ai từ chối tuân thủ luật chơi sẽ phải đối mặt với một đội ngũ pháp lý sẵn sàng sử dụng pháp y kỹ thuật số để bắt quả tang họ .
Vụ bê bối peptide trên Reddit là một hồi chuông cảnh báo cho tương lai của công cụ tìm kiếm được hỗ trợ bởi AI. Nó phơi bày một lỗ hổng căn bản: các mô hình AI chỉ đáng tin cậy như chính dữ liệu huấn luyện của chúng. Phản ứng dây chuyền từ các subreddit khác cho thấy tác động lan rộng. Cộng đồng r/programming khổng lồ (với 6,9 triệu thành viên) đã tiến hành lệnh cấm kéo dài một tháng đối với nội dung do LLM tạo ra vào tháng 4/2026, đặc biệt là để chống lại làn sóng nội dung kém chất lượng, do máy tự động tạo ra, khiến cho việc có những cuộc thảo luận lập trình đích thực trở nên bất khả thi .
Đối với người tiêu dùng, bài học rút ra là rất quan trọng: khi một chatbot AI trích dẫn "người dùng Reddit" như một nguồn cho lời khuyên sức khỏe, thì những "người dùng" đó thực chất có thể là những bot tiếp thị tinh vi, và "sự đồng thuận" mà chúng đại diện có thể đã được chế tạo trong phòng họp của một tập đoàn. Các cơ chế bảo vệ đối với dữ liệu được cấp phép của Reddit tỏ ra chưa đủ mạnh để ngăn chặn các hành vi cấy ghép nội dung có phối hợp ở cấp độ người dùng, khiến cho tính xác thực của chính nền tảng của web AI hiện đại trở nên đáng ngờ .
Comments
0 comments