AI si přečte celý zdroj — nejen nadpisy nebo abstrakty — a posoudí, zda přímo podporuje, vyvrací, nebo s tvrzením nesouvisí. Odhaluje zkreslení, selektivní citování nebo vytrhávání z kontextu . Systém preferuje obsah, který cituje primární data s uvedením zdroje a odkazuje na jiné důvěryhodné weby
. Text anonymního autora citujícího nejmenované „odborníky z oboru“ bez externích referencí je prakticky neověřitelný a pravděpodobně nebude citován
.
Automatizované systémy ověřování faktů křížově srovnávají tvrzení s více nezávislými zdroji. Pokud tvrzení podporuje několik autoritativních zdrojů, je citace pravděpodobnější. Pokud si zdroje protiřečí, systém spolehlivost sníží . Nejde o to, co je „pravda“ v absolutním smyslu — jde o konsensus mezi zdroji, které AI považuje za důvěryhodné
. Systém hledá překryv, konzistenci a shodu napříč zdroji a kontroluje, zda se stejná myšlenka objevuje i jinde v podobné formě
.
Každá kandidátská stránka prochází stejnými pěti kontrolami: dostat se na stránku, přečíst ji, vytáhnout z ní jasnou odpověď, posoudit, zda je zdroj k danému tématu důvěryhodný, zda je dostatečně konkrétní pro ověření tvrzení a zda je aktuální vzhledem k otázce . Stránka se musí přesně shodovat s konkrétní otázkou, nejen s obecným tématem
. Obsah zaměřený na jednu jasnou myšlenku se AI snáze vyhledává a znovu používá než široké nebo smíšené stránky
. Stránka, která projde všemi kontrolami, získá citaci; ta, která u některé selže, je vyhledána, zvážena a pak tiše vyřazena
.
Jakmile má systém správné dokumenty, použije je k ukotvení své odpovědi — to znamená, že generuje odpovědi na základě nalezeného obsahu, nikoli jen na základě svých trénovacích dat. Tento krok má za cíl omezit nepodložená tvrzení a halucinace .
Navzdory všem těmto kontrolám je přesnost AI vyhledávačů při citování zdrojů daleko od dokonalosti. Studie Columbia Journalism Review otestovala osm AI vyhledávačů a zjistila, že citují nesprávné zdroje v alarmující míře — přibližně 60 % . Motory někdy zcela fabulují citace nebo čerpají fakta z nesouvisejících částí zdroje. Jak shrnuje jedna analýza z oboru: ověřovací mechanismy nejsou „ani zdaleka neprůstřelné“
.
Pochopení tohoto procesu pomáhá vysvětlit, proč některé zdroje dostanou citaci a jiné ne. Systém upřednostňuje konsensus nad novinkami, autoritu nad anonymitou a ověřitelnost nad pohodlím. Vysoká chybovost ale znamená, že byste si i nadále měli ověřovat tvrzení z AI u původního zdroje — zejména u zpráv, statistik a časově citlivých informací. AI umí informace najít rychle, ale rozhodnout, zda je bezpečné je zopakovat, je ta těžší část .
Comments
0 comments