AI czyta całe źródło – nie tylko nagłówki czy streszczenia – i sprawdza, czy bezpośrednio popiera ono, zaprzecza lub jest niezwiązane z danym twierdzeniem. Wychwytuje przeinaczenia, wybiórcze cytowanie lub pominięty kontekst . System faworyzuje treści, które cytują dane pierwotne z podaniem nazwisk autorów oraz które linkują do innych wiarygodnych stron i są z nich linkowane
. Treści napisane przez anonimowych autorów, powołujących się na nienazwanych „ekspertów branżowych”, bez żadnych zewnętrznych odniesień, są funkcjonalnie nieweryfikowalne i najprawdopodobniej nie zostaną zacytowane
.
Zautomatyzowane systemy weryfikacji faktów porównują twierdzenia z wieloma niezależnymi źródłami. Jeśli twierdzenie jest poparte przez kilka autorytatywnych źródeł, ma większe szanse na zacytowanie. Jeśli źródła są ze sobą sprzeczne, system może obniżyć jego wiarygodność . To nie chodzi o bycie „prawdziwym” w sensie absolutnym – chodzi o konsensus wśród źródeł, które AI uznaje za wiarygodne
. System szuka nakładania się, spójności i zgodności między źródłami, sprawdzając, czy ten sam pomysł pojawia się gdzie indziej w podobnej formie
.
System uruchamia każdą kandydacką stronę przez te same pięć kontroli: dotarcie do strony, przeczytanie jej, wyciągnięcie jasnej odpowiedzi, ocena czy źródło jest godne zaufania w danej kwestii, sprawdzenie czy jest wystarczająco konkretne do zweryfikowania twierdzenia oraz potwierdzenie, że jest wystarczająco aktualne dla danego pytania . Strona musi ściśle odpowiadać konkretnemu pytaniu, nie tylko ogólnemu tematowi
. Treści skupione na jednej, jasnej koncepcji są łatwiejsze do wyszukania i ponownego wykorzystania przez AI niż strony o szerokim lub mieszanym zakresie tematycznym
. Strona, która przejdzie wszystkie kontrole, zdobywa cytat; strona, która obleje którąkolwiek z nich, zostaje wyszukana, rozważona, a następnie po cichu odrzucona
.
Gdy system ma już odpowiednie dokumenty, używa ich do „uziemienia” swojej odpowiedzi – czyli generuje odpowiedź na podstawie pobranych treści, a nie tylko na podstawie swoich danych treningowych. Ten etap ma na celu zmniejszenie liczby niepotwierdzonych twierdzeń i halucynacji .
Pomimo tych wszystkich kontroli, dokładność wyszukiwarek AI w cytowaniu źródeł jest daleka od doskonałości. Badanie przeprowadzone przez Columbia Journalism Review przetestowało osiem wyszukiwarek AI i odkryło, że cytują one nieprawidłowe źródła w aż około 60% przypadków . Silniki czasami całkowicie zmyślają cytaty lub wyciągają fakty z niezwiązanych sekcji źródła. Jak ujmuje to jedna z analiz branżowych, mechanizmy weryfikacji są „żadne nie są niezawodne”
.
Zrozumienie tego procesu pomaga wyjaśnić, dlaczego jedne źródła są cytowane, a inne nie. System faworyzuje konsensus nad nowością, autorytet nad anonimowością, a weryfikowalność nad wygodą. Jednak wysoki wskaźnik błędów oznacza, że użytkownicy powinni nadal weryfikować twierdzenia pochodzące z AI z oryginalnym źródłem – szczególnie w przypadku wiadomości, statystyk i informacji wrażliwych na czas. AI potrafi szybko znaleźć informacje, ale zdecydowanie, czy można je bezpiecznie powtórzyć, to już trudniejsza sprawa .
Comments
0 comments