呢啲操控行為越嚟越猖狂,猖狂到連Reddit班義工版主都冇辦法再扮睇唔到。喺2026年5月底,r/biohackers版嘅版主做咗一個好激進嘅決定:佢哋禁止晒所有關於勝肽同荷爾蒙補充療法(HRT)嘅新帖文 。
班版主好明確咁講,出禁令唔係因為勝肽呢門科學本身有危險,而係因為嗰啲行業入面嘅公司,有組織咁樣去「操控社群內容」,目的就係要影響大型語言模型(LLMs)講嘅嘢 。個社群內部嘅信任,已經俾班當個討論版係AI操控實驗場嘅營銷人員徹底破壞咗。
呢場仗唔單止係班義工版主喺度打。Reddit嘅公司高層都已經展開咗一場多管齊下嘅法律戰,去保護自己嘅數據生態系統,唔想俾人非法咁爬蟲(Scraping),助長呢啲操控嘅循環。
雖然Reddit好樂意將數據賣俾合作夥伴,但係佢哋對嗰啲未經授權嘅爬蟲公司就好強硬。Reddit將數據爬蟲公司SerpApi、Oxylabs同AWMProxy比喻做「銀行劫匪」同「洗黑錢嘅人」,指控佢哋用「工業規模、非法咁樣繞過」防護措施,將Reddit嘅內容轉賣俾第三方 。
根據法庭文件,Reddit仲用咗一招好狡猾嘅「放蛇」行動嚟搜證:佢哋特登種咗一個只有Google爬蟲先睇到嘅「陷阱」Post出嚟。冇幾耐,呢個Post嘅內容就喺AI搜尋引擎Perplexity AI嘅「答案引擎」入面出現咗——Reddit就話,呢個就係證據,證明Perplexity係由Google嘅搜尋結果度非法爬取內容,而唔係直接攞正牌去攞數據 。就係咁,Reddit喺2025年10月,就向紐約南區聯邦地區法院提出咗訴訟
。Reddit亦都告咗AI模型Claude嘅製造商Anthropic,話佢哋未經許可就用用戶數據去訓練模型
。
呢啲官司,其實係一個更大策略嘅其中一部份,目的就係要話俾全世界聽:Reddit確實係打開門做生意,可以傾數據合作(就好似同Google、OpenAI咁),但係如果有人唔跟規矩玩,佢哋嘅法律團隊就會用盡一切電子蒐證嘅手段,將你捉個正著 。
Reddit上面呢單勝肽醜聞,對於AI驅動搜尋嘅未來嚟講,係一個好大嘅警號。佢暴露咗一個根本性嘅弱點:AI模型有幾信得過,好大程度取決於佢哋嘅訓練數據有幾乾淨。 其他社群嘅反應,都顯示咗呢件事引起嘅連鎖效應。例如,有690萬會員嘅巨無霸社群r/programming(程式設計版),喺2026年4月就試行咗一個月嘅禁令,禁止所有由LLM生成嘅內容,目的就係要對抗嗰啲多到令人冇辦法進行正常編程討論嘅低質素、AI自動產生出嚟嘅「灌水」內容 。
對於消費者嚟講,要點樣理解呢件事,非常關鍵:當一個AI機械人引用「Reddit網友」嘅說話,嚟作為健康建議嘅來源時,嗰班「網友」,實際上可能係一班好高手段嘅營銷機械人,而佢哋所代表嘅「共識」,可能只係喺冷氣會議室入面度出嚟嘅一條橋。 Reddit授權數據上面嘅防護措施,已經證實咗係不足以阻止呢種喺用戶層面進行嘅、有組織嘅內容種植,呢一點,令到現代AI網絡最根基嗰浸嘢——佢嘅真實性,都打咗個大問號 。
Comments
0 comments