एक हमला कुछ सीधे कदमों में अंजाम दिया जा सकता था:
/proc/self/environ फाइल को पढ़ लेता ANTHROPIC_API_KEY से पहले सात अक्षर (sk-ant-) हटा दिए जाते थे यह अटैक सरफेस—जहां डेटा में छिपे हुए सामान्य-भाषा के निर्देश एक्ज़ीक्यूटेबल कमांड बन जाते हैं—प्रॉम्प्ट इंजेक्शन का मूल है। यह एक ऐसा खतरा है जो AI एजेंट्स के लिए सुरक्षा परिदृश्य को तेज़ी से परिभाषित कर रहा है।
एक अहम बात यह है कि यह एक समन्वित खुलासा था जिसमें पहले समस्या का समाधान किया गया।
क्लॉड कोड का यह खुलासा एक बड़े सुरक्षा मूल्यांकन की पृष्ठभूमि में हुआ। एक दिन पहले, 4 जून, 2026 को, माइक्रोसॉफ्ट की AI रेड टीम ने अपनी Taxonomy of Failure Modes in Agentic AI Systems का वर्जन 2.0 प्रकाशित किया । यह बड़ा अपडेट, तैनात AI एजेंट्स के खिलाफ बारह महीनों की वास्तविक दुनिया की रेड-टीम एंगेजमेंट पर आधारित था, और इसमें विफलता की सात पूरी तरह से नई श्रेणियां जोड़ी गईं, जो एक सामान्य कोड-एक्ज़ीक्यूशन खामी से कहीं आगे तक जाती हैं।
ये नए विफलता मोड इस बात में एक महत्वपूर्ण बदलाव दर्शाते हैं कि सुरक्षा शोधकर्ता स्वायत्त AI सिस्टम के बारे में कैसे सोचते हैं:
इस विस्तारित टैक्सोनॉमी ने ढांचे को इसके मूल 27 विफलता मोड से बढ़ाकर 34 कर दिया, जो एजेंटिक सिस्टम की बढ़ती जटिलता और वास्तविक दुनिया में उनके बढ़ते प्रभाव को दर्शाता है ।
क्लॉड कोड केस और व्यापक टैक्सोनॉमी अपडेट के जवाब में, माइक्रोसॉफ्ट ने AI एजेंट्स को अपने बिल्ड पाइपलाइनों में एकीकृत करने वाली किसी भी टीम के लिए सुरक्षा अनुशंसाओं का एक सेट रेखांकित किया। इन दिशा-निर्देशों में इस बात पर ज़ोर दिया गया है कि आंशिक आइसोलेशन एक झूठी सांत्वना है।
इन सभी दिशा-निर्देशों में एक मूल आर्किटेक्चरल सिद्धांत बुना हुआ है जिसे सुरक्षा समुदाय "रूल ऑफ टू" कहता है। मेटा के अक्टूबर 2025 के व्यावहारिक एजेंट सुरक्षा ढांचे से उत्पन्न यह नियम कहता है कि एक एजेंट को निम्नलिखित तीन शर्तों में से दो से अधिक को पूरा नहीं करना चाहिए: (क) अविश्वसनीय इनपुट को प्रोसेस करना, (ख) संवेदनशील डेटा तक पहुंच रखना, और (ग) बाहरी स्थिति को बदलने वाली कार्रवाइयों को अंजाम देने की क्षमता रखना । क्लॉड कोड की यह खामी इस सिद्धांत का एक क्लासिक उल्लंघन थी, क्योंकि एजेंट एक साथ एक अनट्रस्टेड PR से इनपुट हैंडल कर रहा था और उसके पास शक्तिशाली क्रेडेंशियल्स भी थे।
Comments
0 comments