ऐसा इसलिए होता है क्योंकि AI मॉडल कई स्रोतों से जानकारी जोड़ सकते हैं, जैसे:
जब AI इन सभी टुकड़ों को एक ही जवाब में जोड़ देता है, तो जानकारी तक पहुंच पहले से कहीं ज्यादा आसान हो जाती है ।
रिपोर्ट और शोध कई ऐसे कारण बताते हैं जिनसे AI सिस्टम संवेदनशील संपर्क जानकारी दिखा सकते हैं।
बड़े भाषा मॉडल विशाल डेटासेट पर प्रशिक्षित होते हैं, जिनमें वेब पेज, दस्तावेज़ और कभी‑कभी सरकारी रिकॉर्ड भी शामिल हो सकते हैं। यदि इन स्रोतों में फोन नंबर या पता मौजूद है, तो कुछ परिस्थितियों में चैटबॉट उसे दोहरा सकता है ।
कई बार डेटा तकनीकी रूप से सार्वजनिक होता है—जैसे संपत्ति रिकॉर्ड या डायरेक्टरी। लेकिन पहले इन्हें ढूंढने के लिए कई वेबसाइटें खंगालनी पड़ती थीं। AI इन्हें तुरंत जोड़कर एक ही जवाब में दे सकता है ।
कभी‑कभी चैटबॉट सही डेटा नहीं निकाल रहा होता बल्कि गलत अनुमान लगा रहा होता है। ऐसे मामलों में किसी असली व्यक्ति का फोन नंबर गलती से किसी कंपनी या सेवा के संपर्क नंबर के रूप में दिखाया जा सकता है ।
कुछ शोधकर्ताओं ने पाया कि यदि उपयोगकर्ता सवाल को धीरे‑धीरे अधिक विशिष्ट बनाते जाएं, तो AI सुरक्षा फ़िल्टर को दरकिनार करते हुए संवेदनशील जानकारी दे सकता है ।
हालांकि अभी इस समस्या पर व्यापक आंकड़े सीमित हैं, लेकिन कई रिपोर्टेड घटनाएं इसके वास्तविक असर दिखाती हैं।
• अजनबी लोगों के फोन कॉल: कुछ लोगों ने बताया कि उन्हें अजनबियों के फोन आने लगे, जिन्होंने कहा कि उन्हें नंबर AI चैटबॉट से मिला जब वे किसी सेवा—जैसे वकील या ताला‑साज—की तलाश कर रहे थे ।
• “AI ने आपका नंबर दिया” वाली परेशानी: एक व्यक्ति ने बताया कि कॉल करने वाले बार‑बार यही कहते थे कि चैटबॉट ने उसका नंबर किसी सेवा के संपर्क के रूप में दिया, जिससे लगातार परेशान करने वाले कॉल आने लगे ।
• सॉफ्टवेयर डेवलपर को गलत कॉल: एक मामले में एक इज़राइली डेवलपर को ग्राहकों के कॉल आने लगे क्योंकि एक AI सिस्टम ने उसका निजी नंबर किसी सेवा हेल्पलाइन के रूप में दे दिया था ।
• शोधकर्ताओं द्वारा डेटा निकालना: यूनिवर्सिटी ऑफ वॉशिंगटन के शोधकर्ताओं ने प्रयोग में पाया कि कुछ प्रॉम्प्ट्स के जरिए सहकर्मी का फोन नंबर और प्रोफेसर का घर का पता भी चैटबॉट से निकल सकता था ।
• घर के पते उजागर होना: कुछ जांचों में यह भी सामने आया कि AI सिस्टम नाम पूछने पर निजी व्यक्तियों के आवासीय पते तक दिखा सकते हैं ।
ये घटनाएं दिखाती हैं कि अनजाने में भी हुई जानकारी की लीक वास्तविक दुनिया में गंभीर असर डाल सकती है।
AI से पहले बहुत‑सी व्यक्तिगत जानकारी एक तरह की “व्यावहारिक अस्पष्टता” (practical obscurity) में रहती थी। यानी वह तकनीकी रूप से सार्वजनिक थी, लेकिन उसे ढूंढना मुश्किल था।
उदाहरण के लिए, किसी का पता ढूंढने के लिए कई सरकारी डेटाबेस या पुराने रिकॉर्ड खंगालने पड़ सकते थे।
AI चैटबॉट इस प्रक्रिया को बेहद आसान बना देते हैं—सिर्फ एक साधारण सवाल से वे रिकॉर्ड खोजकर सारांश दे सकते हैं। नतीजतन, पहले छिपी हुई जानकारी भी तुरंत सामने आ सकती है ।
इसी वजह से कुछ विशेषज्ञ चेतावनी देते हैं कि AI सिस्टम व्यवहार में स्वचालित डेटा ब्रोकर की तरह काम करने लग सकते हैं।
निजी जानकारी को AI सिस्टम से पूरी तरह हटाना तकनीकी रूप से आसान नहीं है। इसके कई कारण हैं:
एक ही फोन नंबर या पता अलग‑अलग जगहों—वेब आर्काइव, सरकारी रिकॉर्ड, ऑनलाइन डायरेक्टरी—में मौजूद हो सकता है। एक स्रोत हटाने से समस्या खत्म नहीं होती ।
भाषा मॉडल जानकारी को किसी टेबल में स्टोर नहीं करते; वे पैटर्न के रूप में सीखते हैं। इसलिए ट्रेनिंग के बाद किसी खास रिकॉर्ड को सटीक रूप से हटाना कठिन हो जाता है।
कई AI कंपनियां व्यक्तिगत संपर्क जानकारी देने से रोकने के लिए फ़िल्टर लगाती हैं। लेकिन रिपोर्टों के अनुसार, अलग‑अलग शब्दों या संदर्भों में ये फ़िल्टर हमेशा एक‑जैसे काम नहीं करते ।
कुछ शोध बताते हैं कि AI सेवाओं की गोपनीयता नीतियां अक्सर जटिल और अस्पष्ट होती हैं, जिससे लोगों को समझना मुश्किल होता है कि उनका डेटा कैसे उपयोग हो रहा है या हटाने की प्रक्रिया क्या है ।
गोपनीयता विशेषज्ञ और AI कंपनियां इस जोखिम को कम करने के लिए कई उपायों पर काम कर रही हैं।
डेटा न्यूनतमकरण (Data minimization): शोधकर्ता सुझाव देते हैं कि ट्रेनिंग के दौरान ऐसे स्रोतों को हटाया जाए जिनमें व्यक्तिगत संपर्क जानकारी होने की संभावना हो ।
बेहतर परीक्षण और सुरक्षा जांच: कंपनियां ऐसे प्रॉम्प्ट से सिस्टम को टेस्ट कर सकती हैं जो संभावित doxxing व्यवहार को उजागर करें, ताकि सुरक्षा उपाय मजबूत किए जा सकें ।
संवेदनशील जानकारी ब्लॉक करना: कुछ AI सिस्टम अब निजी फोन नंबर या घर का पता देने से सीधे इनकार कर देते हैं, भले ही वह जानकारी सार्वजनिक रिकॉर्ड में मौजूद हो ।
तेज़ शिकायत और हटाने की प्रक्रिया: विशेषज्ञ कहते हैं कि जिन लोगों की जानकारी AI आउटपुट में आ जाती है, उनके लिए स्पष्ट और तेज़ अपील या हटाने का विकल्प होना चाहिए ।
फिर भी, AI मॉडलों के विशाल डेटा और जटिल संरचना के कारण इस जोखिम को पूरी तरह खत्म करना अभी चुनौती बना हुआ है।
AI doxxing एक बड़े सवाल की ओर इशारा करता है—जनरेटिव AI उन जानकारियों को भी आसानी से उपलब्ध करा सकता है जो पहले मुश्किल से मिलती थीं।
यह जरूरी नहीं कि वह डेटा पूरी तरह गुप्त था। लेकिन AI की गति, स्वचालन और बातचीत जैसा इंटरफ़ेस उस जानकारी के प्रभाव को कई गुना बढ़ा सकता है।
जैसे‑जैसे AI असिस्टेंट सर्च इंजन, मैसेजिंग ऐप और रोजमर्रा के डिजिटल टूल्स में शामिल होते जा रहे हैं, विशेषज्ञों का कहना है कि बेहतर सुरक्षा उपाय और स्पष्ट गोपनीयता नियम जरूरी हो सकते हैं ताकि लोगों की संवेदनशील जानकारी अनजाने में उजागर न हो ।
Comments
0 comments