अंदरूनी तौर पर यही हो रहा है:
['journ', 'alism']गूगल ने टेकक्रंच को ईमेल से दिए एक बयान में कहा, "शब्दों के भीतर गिनती करना LLMs के लिए एक जानी-मानी चुनौती रही है, और हम इस विशेष समस्या को ठीक करने पर काम कर रहे हैं ।" लेकिन जैसा कि शोधकर्ताओं ने नोट किया है, खरबों टोकन पर प्रशिक्षित, सैकड़ों अरब पैरामीटर वाले मॉडल भी 'स्ट्रॉबेरी' (strawberry) में 'R' की संख्या गिनने में विश्वसनीय नहीं हो पाते
। समस्या संरचनात्मक है, पैमाने का मामला नहीं।
यह स्पेलिंग कांड कोई अकेली घटना नहीं है। यह दो साल से चल रही हाई-प्रोफाइल AI ओवरव्यूज़ त्रुटियों की श्रृंखला की नवीनतम कड़ी है। ये सभी त्रुटियाँ धाराप्रवाह टेक्स्ट जेनरेशन और उन सटीक ऑपरेशनों के बीच के बुनियादी अंतर से उपजी हैं जो एक सर्च इंजन को करने होते हैं।
मई 2024 में अमेरिकी रोलआउट के कुछ ही दिनों के भीतर, AI ओवरव्यूज़ ने वायरल बकवास जवाबों की झड़ी लगा दी :
गूगल की सर्च प्रमुख, लिज़ रीड ने स्वीकार किया कि "अलग-थलग उदाहरण" "निरर्थक" थे और उन्होंने इसके लिए "सूचना अंतराल" और AI द्वारा व्यंग्य व निम्न-गुणवत्ता वाले स्रोतों से लेने को जिम्मेदार ठहराया
। कंपनी ने कहा कि उसने सुधार किए हैं, जिसमें स्वास्थ्य-संबंधी और संवेदनशील प्रश्नों के लिए AI ओवरव्यूज़ को सीमित करना शामिल है
।
22 मई, 2026 को यूज़र्स ने पाया कि "disregard" (अनदेखा करें) शब्द सर्च करने पर — और साथ ही "ignore," "dismiss," "skip," और "stop" जैसे संबंधित शब्दों पर — AI ओवरव्यूज़ ने एक चैटबॉट-स्टाइल जवाब देना शुरू कर दिया: "समझ गया। मैंने आपके पिछले निर्देश को अनदेखा कर दिया है। अब मैं आपकी कैसे मदद कर सकता हूँ?"
।
शब्द का शब्दकोशीय अर्थ लौटाने के बजाय, AI ने एक साधारण प्रश्न को सिस्टम-लेवल के निर्देश के रूप में समझ लिया। इस बग ने उन शब्दों के लिए गूगल के सर्च इंटरफ़ेस को तोड़ दिया, और नतीजों की जगह एक खाली जगह दिखाने लगा
। गूगल ने समस्या स्वीकार की और कहा कि समाधान जल्द आ रहा है
। सुरक्षा शोधकर्ताओं ने इसे एक क्लासिक प्रॉम्प्ट इंजेक्शन परिदृश्य के रूप में पहचाना — मॉडल सामान्य सर्च शब्दों को AI असिस्टेंट के लिए कमांड समझने की गलती कर रहा था
।
"डिसरिगार्ड" घटना के कुछ ही दिनों बाद, अक्षर गिनने की त्रुटियाँ सामने आईं। AI अपनी ही मूल कंपनी का नाम नहीं लिख पाया, सरल शब्दों में अक्षरों की गलत गिनती की, और यहाँ तक कि "Trump" को "t-r-p-u-m" लिख दिया । कई प्रतिष्ठित समाचार आउटलेट्स ने स्वतंत्र रूप से इन त्रुटियों की पुष्टि की
।
इन तीनों श्रेणियों की विफलताओं में जो चीज़ समान है, वह आर्किटेक्चरल है, आकस्मिक नहीं। गूगल ने एक पारंपरिक कीवर्ड-मैचिंग सर्च इंजन को एक जनरेटिव LLM से बदल दिया, जो धाराप्रवाह टेक्स्ट जेनरेट करने में तो माहिर है, लेकिन जिसके पास इन चीज़ों के लिए मशीनरी का अभाव है:
मॉडल आत्मविश्वास से गलत जवाब इसलिए देता है क्योंकि यह बुनियादी स्तर पर कभी इन कार्यों को संभालने के लिए बनाया ही नहीं गया था, जो अब इसे एक लाइव सर्च एनवायरनमेंट में करने के लिए कहा जा रहा है। हर वायरल विफलता उस खाई को उजागर करती है जो LLMs की खूबियों (प्रशंसनीय लगने वाले टेक्स्ट की भविष्यवाणी) और एक भरोसेमंद सर्च इंजन की ज़रूरतों (तथ्यात्मक सटीकता, अक्षर-शुद्धता, और निर्देश इंजेक्शन के प्रति प्रतिरोध) के बीच मौजूद है।
जब तक इन आर्किटेक्चरल सीमाओं को अलग-अलग क्वेरी टाइप पर पैबंद लगाने से कहीं अधिक गहरे स्तर पर संबोधित नहीं किया जाता, तब तक AI ओवरव्यूज़ शायद गलत कारणों से सुर्खियाँ बनाते रहेंगे।
Comments
0 comments