AI membaca sumber penuh — bukan hanya tajuk atau abstrak — dan menyemak sama ada sumber itu secara langsung menyokong, bercanggah, atau tidak berkaitan dengan tuntutan. Ia mengesan salah nyata, petikan terpilih, atau konteks yang ditinggalkan . Sistem memihak kepada kandungan yang memetik data primer dengan sumber bernama dan yang memaut ke dan dari tapak kredibel lain
. Kandungan oleh pengarang tanpa nama yang memetik "pakar industri" tanpa nama tanpa rujukan luaran secara fungsinya tidak boleh disahkan dan tidak mungkin dipetik
.
Sistem semak fakta automatik merujuk silang tuntutan terhadap pelbagai sumber bebas. Jika tuntutan disokong oleh beberapa sumber berwibawa, ia lebih berkemungkinan dipetik. Jika sumber bercanggah antara satu sama lain, sistem mungkin menurunkan kebolehpercayaan . Ini bukan tentang menjadi "betul" secara mutlak — ia tentang konsensus di kalangan sumber yang AI anggap kredibel
. Sistem mencari pertindihan, konsistensi, dan persetujuan merentas sumber, menyemak sama ada idea yang sama muncul di tempat lain dalam bentuk yang serupa
.
Sistem menjalankan setiap halaman calon melalui lima semakan yang sama: capai halaman, bacanya, tarik jawapan yang jelas daripadanya, timbang sama ada sumber itu boleh dipercayai mengenai topik tertentu, semak sama ada ia cukup spesifik untuk mengesahkan tuntutan, dan sahkan sama ada ia cukup terkini untuk soalan itu . Halaman mesti sepadan rapat dengan soalan khusus yang dijawab, bukan hanya topik umum
. Kandungan yang fokus pada satu konsep yang jelas lebih mudah untuk AI dapatkan dan guna semula berbanding halaman yang luas atau bercampur topik
. Halaman yang lulus semua semakan layak mendapat petikan; halaman yang gagal mana-mana satu akan diambil, dipertimbangkan, kemudian digugurkan secara senyap
.
Setelah sistem mendapat dokumen yang betul, ia menggunakannya untuk menggajikan respons — bermakna ia menjana jawapan berdasarkan kandungan yang diambil semula daripada hanya bergantung pada data latihannya. Langkah penggajian ini bertujuan untuk mengurangkan tuntutan yang tidak disokong dan halusinasi .
Walaupun semua semakan ini, ketepatan enjin carian AI semasa memetik sumber adalah jauh dari sempurna. Satu kajian Columbia Journalism Review menguji lapan enjin carian AI dan mendapati bahawa ia memetik sumber yang salah pada kadar yang membimbangkan — kira-kira 60% . Enjin kadang-kadang memalsukan petikan sepenuhnya atau menarik fakta dari bahagian sumber yang tidak berkaitan. Seperti yang dinyatakan oleh satu analisis industri, mekanisme pengesahan adalah "tiada yang kalis"
.
Memahami saluran paip ini membantu menjelaskan mengapa sesetengah sumber dipetik manakala yang lain tidak. Sistem mengutamakan konsensus berbanding kebaharuan, kewibawaan berbanding kerahasiaan, dan kebolehverifikasian berbanding kemudahan. Tetapi kadar ralat yang tinggi bermakna pengguna masih harus mengesahkan tuntutan sumber AI terhadap sumber asal — terutamanya untuk berita, statistik, dan maklumat sensitif masa. AI boleh mencari maklumat dengan cepat, tetapi memutuskan sama ada ia selamat untuk diulang adalah bahagian yang sukar .
Comments
0 comments