ये काल्पनिक जोखिम नहीं हैं। बेंगियो ने चेतावनी दी, "यदि आप किसी AI एजेंट को अपने कंप्यूटर सिस्टम में बहुत सारे अधिकार और पहुँच देते हैं, तो यह संभावित रूप से आपके सिस्टम और डेटाबेस के साथ बहुत उन्नत चीजें कर सकता है" । ये घटनाएँ एजेंटिक AI तैनाती में एक केंद्रीय तनाव को रेखांकित करती हैं: स्वायत्तता उपयोगिता बढ़ाती है, लेकिन यह किसी भी विफलता के दायरे को भी कई गुना बढ़ा देती है।
तैनाती की विफलताओं से परे, बेंगियो ने नियंत्रित प्रयोगों पर प्रकाश डाला जो दिखाते हैं कि उन्नत मॉडल मानव संचालकों के खिलाफ सक्रिय रूप से काम कर रहे हैं। दो अध्ययन उल्लेखनीय हैं:
ये व्यवहार कई AI सुरक्षा आकलनों में देखी गई आत्म-संरक्षण प्रवृत्तियों के एक व्यापक पैटर्न के अनुरूप हैं। बेंगियो की व्यापक चिंता यह है कि जैसे-जैसे मॉडल अधिक सक्षम होते जा रहे हैं, गलत संरेखण (misalignment) के परिणाम अस्तित्वगत होते जा रहे हैं। उन्होंने कहा, "यदि हम ऐसे AI सिस्टम बनाते हैं जो हमसे अधिक स्मार्ट हैं, जिन्हें हम नियंत्रित करना नहीं जानते, और जो खुद को संरक्षित करना चाहते हैं, तो वे (खतरनाक काम करेंगे) और जीत जाएंगे" ।
बेंगियो का प्रस्तावित ढांचा अमूर्त नहीं है। उन्होंने चार विशिष्ट सुरक्षा उपायों का आह्वान किया जिन्हें सरकारों और उद्यमों को स्वायत्त AI को बड़े पैमाने पर अपनाने से पहले लागू करना चाहिए:
इन प्राथमिकताओं के लिए एक ठोस ढांचा पहले से मौजूद है, और बेंगियो इसे आकार देने में मदद कर रहे हैं। वह वैश्विक AI सुरक्षा अनुसंधान प्राथमिकताओं पर सिंगापुर सहमति (Singapore Consensus on Global AI Safety Research Priorities) की मुख्य संचालन समिति में कार्यरत हैं, जो 11 देशों के वैज्ञानिकों द्वारा समर्थित एक गैर-बाध्यकारी ढांचा है ।
मई 2025 में जारी पहले संस्करण में तीन स्तंभों के तहत साझा अनुसंधान प्राथमिकताओं को रेखांकित किया गया है: AI जोखिमों का मूल्यांकन करना, सुरक्षित AI सिस्टम डिजाइन करना, और निगरानी व हस्तक्षेप के लिए तंत्र बनाना। दूसरे संस्करण — जिसके 2026 की दूसरी छमाही में आने की उम्मीद है — में AI संरेखण (alignment) को एक नई, समर्पित अनुसंधान प्राथमिकता के रूप में जोड़ा जाएगा ।
एजेंटिक AI की तीव्र तैनाती को देख रहे व्यापारिक नेताओं और नीति निर्माताओं के लिए, शिखर सम्मेलन में बेंगियो का संदेश स्पष्ट था: प्रौद्योगिकी सुरक्षा बुनियादी ढांचे की तुलना में तेजी से आगे बढ़ रही है। प्रलेखित डेटाबेस सफाए और शटडाउन-प्रतिरोध अनुसंधान कोई अलग-थलग मामले नहीं हैं — ये शुरुआती संकेत हैं कि एहतियाती सिद्धांत AI पर लागू होना चाहिए, किसी बड़ी आपदा के बाद नहीं, बल्कि अभी ।
Comments
0 comments