AI membaca seluruh sumber—bukan hanya judul atau abstrak—dan memeriksa apakah sumber tersebut secara langsung mendukung, bertentangan, atau tidak terkait dengan klaim. Sistem ini bisa mendeteksi misrepresentasi, kutipan selektif, atau konteks yang dihilangkan . AI lebih menyukai konten yang mengutip data primer dengan sumber bernama, serta yang memiliki tautan ke dan dari situs kredibel lainnya
. Konten oleh penulis anonim yang mengutip "pakar industri" tanpa nama dan tanpa referensi eksternal pada dasarnya tidak dapat diverifikasi dan kecil kemungkinannya untuk dikutip
.
Sistem verifikasi fakta otomatis membandingkan klaim dari berbagai sumber independen. Jika sebuah klaim didukung oleh beberapa sumber otoritatif, kemungkinan besar akan dikutip. Jika sumber saling bertentangan, sistem bisa menurunkan tingkat keandalannya . Ini bukan soal "benar" secara absolut—melainkan soal konsensus di antara sumber yang dianggap kredibel oleh AI
. Sistem mencari tumpang tindih, konsistensi, dan kesepakatan antar sumber, memeriksa apakah gagasan yang sama muncul di tempat lain dalam bentuk serupa
.
Sistem menjalankan setiap halaman kandidat melalui lima pemeriksaan yang sama: menjangkau halaman tersebut, membacanya, mengambil jawaban yang jelas, menimbang apakah sumber tepercaya untuk topik spesifik, memeriksa apakah sumber cukup spesifik untuk memverifikasi klaim, dan memastikan sumber masih relevan dengan pertanyaan . Sebuah halaman harus sangat cocok dengan pertanyaan spesifik yang diajukan, bukan hanya topik umum
. Konten yang fokus pada satu konsep yang jelas lebih mudah diambil dan digunakan ulang oleh AI dibandingkan halaman yang luas atau campuran topik
. Halaman yang lolos semua pemeriksaan mendapat kutipan; halaman yang gagal di salah satu akan diambil, dipertimbangkan, lalu diam-diam dijatuhkan
.
Setelah sistem memiliki dokumen yang tepat, sistem menggunakannya untuk "grounding" respons—artinya, sistem menghasilkan jawaban berdasarkan konten yang diambil, bukan hanya mengandalkan data pelatihan. Langkah grounding ini bertujuan mengurangi klaim yang tidak didukung dan halusinasi .
Meski melalui semua pemeriksaan ini, akurasi mesin pencari AI dalam mengutip sumber masih jauh dari sempurna. Sebuah studi dari Columbia Journalism Review menguji delapan mesin pencari AI dan menemukan bahwa mereka mengutip sumber yang salah pada tingkat yang mengkhawatirkan—sekitar 60% . Mesin tersebut terkadang memalsukan kutipan sepenuhnya atau mengambil fakta dari bagian sumber yang tidak relevan. Seperti diungkapkan dalam satu analisis industri, mekanisme verifikasi "tidak ada yang sempurna"
.
Memahami pipeline ini membantu menjelaskan mengapa beberapa sumber dikutip sementara yang lain tidak. Sistem memprioritaskan konsensus di atas kebaruan, otoritas di atas anonimitas, dan verifiabilitas di atas kemudahan. Namun, tingkat kesalahan yang tinggi berarti pengguna tetap harus memverifikasi klaim yang dihasilkan AI terhadap sumber asli—terutama untuk berita, statistik, dan informasi yang sensitif terhadap waktu. AI memang bisa menemukan informasi dengan cepat, tetapi memutuskan apakah informasi itu aman untuk diulang adalah bagian yang sulit .
Comments
0 comments