AI पूरे स्रोत को पढ़ता है — सिर्फ हेडलाइन या सारांश नहीं — और जांचता है कि क्या स्रोत सीधे दावे का समर्थन करता है, उसका खंडन करता है, या उससे असंबंधित है। यह गलत प्रस्तुति, चुनिंदा उद्धरण, या छोड़े गए संदर्भ को पकड़ता है । सिस्टम उस सामग्री को पसंद करता है जो नामित स्रोतों के साथ प्राथमिक डेटा का हवाला देती है और जो अन्य विश्वसनीय साइटों से लिंक करती है और उनसे लिंक प्राप्त करती है
। अज्ञात लेखकों द्वारा बिना किसी बाहरी संदर्भ के "उद्योग विशेषज्ञों" का हवाला देने वाली सामग्री व्यावहारिक रूप से असत्यापनीय (unverifiable) होती है और इसके उद्धृत होने की संभावना नहीं होती
।
स्वचालित फैक्ट-चेकिंग सिस्टम कई स्वतंत्र स्रोतों के खिलाफ दावों की क्रॉस-रेफरेंस करते हैं। यदि कोई दावा कई आधिकारिक स्रोतों द्वारा समर्थित है, तो इसके उद्धृत होने की अधिक संभावना होती है। यदि स्रोत एक-दूसरे का खंडन करते हैं, तो सिस्टम विश्वसनीयता को कम कर सकता है । यह निरपेक्ष रूप से "सही" होने के बारे में नहीं है — यह उन स्रोतों के बीच आम सहमति (consensus) के बारे में है, जिन्हें AI विश्वसनीय मानता है
। सिस्टम स्रोतों के बीच ओवरलैप, संगति और समझौते की तलाश करता है, और जांचता है कि क्या वही विचार कहीं और समान रूप में दिखाई देता है
।
सिस्टम हर उम्मीदवार पेज को पाँच समान जाँचों से गुज़ारता है: पेज तक पहुँचना, उसे पढ़ना, उसमें से एक स्पष्ट उत्तर निकालना, यह तौलना कि क्या स्रोत विशिष्ट विषय पर भरोसेमंद है, यह जाँचना कि क्या वह दावे को सत्यापित करने के लिए पर्याप्त विशिष्ट है, और पुष्टि करना कि वह प्रश्न के लिए पर्याप्त नवीनतम (current) है । एक पेज को सामान्य विषय के बजाय विशिष्ट प्रश्न से निकटता से मेल खाना चाहिए
। एक स्पष्ट अवधारणा पर केंद्रित सामग्री, AI के लिए व्यापक या मिश्रित-विषय वाले पृष्ठों की तुलना में पुनर्प्राप्त करना और पुन: उपयोग करना आसान होता है
। एक पेज जो हर जाँच को पास करता है, उद्धरण अर्जित करता है; एक पेज जो किसी एक में भी विफल होता है, उसे पुनर्प्राप्त किया जाता है, विचार किया जाता है, और फिर चुपचाप गिरा दिया जाता है
।
एक बार जब सिस्टम के पास सही दस्तावेज़ आ जाते हैं, तो वह उनका उपयोग अपनी प्रतिक्रिया को आधार (ground) देने के लिए करता है — यानी, वह केवल अपने प्रशिक्षण डेटा पर निर्भर रहने के बजाय प्राप्त सामग्री के आधार पर उत्तर उत्पन्न करता है। इस ग्राउंडिंग चरण का उद्देश्य असमर्थित दावों और भ्रम को कम करना है ।
इन सभी जाँचों के बावजूद, स्रोतों का हवाला देते समय AI सर्च इंजनों की सटीकता सही से बहुत दूर है। कोलंबिया जर्नलिज्म रिव्यू (Columbia Journalism Review) के एक अध्ययन ने आठ AI सर्च इंजनों का परीक्षण किया और पाया कि वे लगभग 60% मामलों में गलत स्रोतों का हवाला देते हैं — यह एक चिंताजनक दर है । ये इंजन कभी-कभी पूरी तरह से उद्धरण गढ़ देते हैं या किसी स्रोत के असंबंधित अनुभागों से तथ्य खींच लेते हैं। जैसा कि एक उद्योग विश्लेषण में कहा गया है, सत्यापन तंत्र "कोई भी पूरी तरह से विश्वसनीय नहीं है" (none foolproof)
।
इस पाइपलाइन को समझने से यह पता चलता है कि कुछ स्रोतों को क्यों उद्धृत किया जाता है जबकि दूसरों को नहीं। सिस्टम सर्वसम्मति को नवीनता पर, साख को गुमनामी पर, और सत्यापनीयता को सुविधा पर प्राथमिकता देता है। लेकिन उच्च त्रुटि दर का मतलब है कि उपयोगकर्ताओं को अभी भी AI-स्रोतित दावों को मूल स्रोत के खिलाफ सत्यापित करना चाहिए — विशेष रूप से समाचार, आँकड़े और समय-संवेदनशील जानकारी के लिए। AI जल्दी से जानकारी खोज सकता है, लेकिन यह तय करना कि इसे दोहराना सुरक्षित है या नहीं, सबसे कठिन हिस्सा है ।
Comments
0 comments