Il metodo, smascherato da moderatori e ricercatori indipendenti, segue un copione preciso:
La manipolazione è diventata infine troppo evidente per i moderatori volontari. A fine maggio 2026, i mod di r/biohackers hanno preso una decisione drastica: hanno vietato qualsiasi nuovo post autonomo su peptidi e terapie ormonali sostitutive (HRT) .
I moderatori hanno dichiarato esplicitamente che il divieto non nasceva dalla pericolosità della scienza dei peptidi, ma da uno "sforzo coordinato delle aziende di quei settori per manipolare il contenuto della comunità", con lo scopo di influenzare ciò che i large language model avrebbero detto . La fiducia nella comunità era stata infranta da marketer che trattavano il subreddit come un campo di addestramento per l'IA.
La battaglia non è combattuta solo dai moderatori volontari. La dirigenza di Reddit ha lanciato una campagna legale su più fronti per proteggere il proprio ecosistema di dati dallo scraping non autorizzato.
Se da un lato Reddit vende volentieri i propri dati ai partner, è stata molto aggressiva con chi li raschia senza permesso. L'azienda ha paragonato le società di data-scraping SerpApi, Oxylabs e AWMProxy a "rapinatori di banche" e "riciclatori di dati", accusandole di "elusione illegale su scala industriale" per rivendere i contenuti di Reddit a terzi .
In un'astuta operazione sotto copertura, riportata nei documenti del tribunale, Reddit ha piazzato un post "trappola" visibile solo al crawler di Google. Quel post è poi apparso nel "motore di risposta" di Perplexity AI, dimostrando – sostiene Reddit – che Perplexity aveva raschiato i contenuti dai risultati di ricerca di Google invece di ottenerli in licenza . Questo ha portato a una causa milionaria intentata nell'ottobre 2025 presso il Distretto Sud di New York
. Reddit ha poi fatto causa anche ad Anthropic, il creatore del modello Claude, per aver addestrato i suoi modelli sui dati degli utenti senza permesso
.
Queste cause sono parte di una strategia più ampia per lanciare un segnale: Reddit è aperta a contratti sui dati, ma chi rifiuta di rispettare le regole si troverà di fronte un team legale disposto a usare la polizia digitale per cogliere i trasgressori con le mani nel sacco .
Lo scandalo dei peptidi su Reddit è un campanello d'allarme per il futuro della ricerca potenziata dall'IA. Mette a nudo una vulnerabilità fondamentale: i modelli sono affidabili tanto quanto i dati su cui vengono addestrati. Le reazioni a catena in altre comunità lo dimostrano. L'enorme comunità r/programming (con 6,9 milioni di membri) ha imposto un divieto di un mese ai contenuti generati da LLM nell'aprile 2026, proprio per combattere l'inondazione di materiale di bassa qualità che rendeva impossibile discutere seriamente di codice .
Per noi utenti, la lezione è fondamentale: quando un chatbot cita gli "utenti di Reddit" come fonte di consigli sulla salute, quegli "utenti" potrebbero in realtà essere sofisticati bot di marketing, e il "consenso" che rappresentano potrebbe essere stato fabbricato in una sala riunioni. Le misure di sicurezza sui dati concessi in licenza da Reddit si sono dimostrate insufficienti a fermare l'inquinamento organizzato dei contenuti, gettando un'ombra sull'autenticità delle fondamenta stesse del moderno web dell'IA .
Comments
0 comments