L'AI legge la fonte per intero — non solo titoli o abstract — e verifica se la fonte supporta direttamente, contraddice o è estranea all'affermazione. Individua travisamenti, citazioni selettive o contesti omessi . I sistemi favoriscono i contenuti che citano dati primari con fonti nominali e che collegano ad altri siti credibili e ne ricevono link
. I contenuti scritti da autori anonimi che citano "esperti del settore" senza nome e senza riferimenti esterni sono funzionalmente non verificabili e difficilmente verranno citati
.
I sistemi di fact-checking automatico incrociano le affermazioni con più fonti indipendenti. Se un'affermazione è supportata da diverse fonti autorevoli, è più probabile che venga citata. Se le fonti sono in contraddizione tra loro, il sistema può declassare l'affidabilità . Non si tratta di essere "giusti" in senso assoluto: si tratta del consenso tra le fonti che l'AI considera credibili
. Il sistema cerca sovrapposizioni, coerenza e concordanza tra le fonti, verificando se la stessa idea appare altrove in una forma simile
.
Il sistema sottopone ogni pagina candidata alla stessa sequenza di cinque controlli: raggiungere la pagina, leggerla, estrarne una risposta chiara, valutare se la fonte è attendibile sull'argomento specifico, verificare se è sufficientemente specifica per convalidare l'affermazione e confermare che sia sufficientemente aggiornata per la domanda . Una pagina deve corrispondere strettamente alla domanda specifica, non solo all'argomento generale
. I contenuti focalizzati su un unico concetto chiaro sono più facili da recuperare e riutilizzare per l'AI rispetto a pagine ampie o con argomenti misti
. Una pagina che supera tutti i controlli si guadagna la citazione; una che ne fallisce uno qualsiasi viene recuperata, considerata e poi scartata silenziosamente
.
Una volta che il sistema ha i documenti giusti, li usa per "ancorare" la sua risposta, generando risposte basate sul contenuto recuperato invece di fare affidamento esclusivamente sui dati di addestramento. Questo passaggio di grounding mira a ridurre le affermazioni infondate e le allucinazioni .
Nonostante tutti questi controlli, l'accuratezza dei motori di ricerca AI nel citare le fonti è tutt'altro che perfetta. Uno studio del Columbia Journalism Review ha testato otto motori di ricerca AI e ha scoperto che citano fonti errate a un tasso allarmante — circa il 60% . A volte i motori inventano di sana pianta le citazioni o estraggono fatti da sezioni non correlate della fonte. Come afferma un'analisi del settore, i meccanismi di verifica "non sono infallibili"
.
Capire questa pipeline aiuta a spiegare perché alcune fonti vengono citate e altre no. Il sistema dà priorità al consenso sulla novità, all'autorità sull'anonimato e alla verificabilità sulla comodità. Ma l'alto tasso di errore significa che gli utenti dovrebbero comunque verificare le affermazioni generate dall'AI sulla fonte originale, in particolare per notizie, statistiche e informazioni sensibili al fattore tempo. L'AI può trovare informazioni rapidamente, ma decidere se sia sicuro ripeterle è la parte difficile .
Comments
0 comments