सामान्यतः इस तरह का विश्लेषण अनुभवी सुरक्षा शोधकर्ताओं द्वारा किया जाता है।
एक और महत्वपूर्ण खोज थी कि Mythos स्वतः PoC exploit कोड तैयार कर सकता है।
Cloudflare के अनुसार मॉडल:
इस तरह का iterative testing मॉडल को vulnerability खोजने से आगे बढ़कर वास्तविक exploit की पुष्टि करने में सक्षम बनाता है।
सुरक्षा टीमों के लिए PoC बनाना अक्सर वह चरण होता है जिससे यह साबित होता है कि कोई बग वास्तव में खतरनाक है। यदि यह काम स्वचालित हो जाए, तो कमजोरियों की प्राथमिकता तय करना कहीं तेज हो सकता है।
Anthropic के अपने दस्तावेज़ बताते हैं कि Mythos Preview ने आंतरिक परीक्षणों में कई और क्षमताएँ भी दिखाईं, जैसे:
यह दर्शाता है कि मॉडल का लक्ष्य सामान्य कोडिंग सहायता नहीं बल्कि संरचित vulnerability analysis और exploit reasoning है।
हालाँकि क्षमताएँ प्रभावशाली थीं, लेकिन Cloudflare के परीक्षण में कुछ कमजोरियाँ भी सामने आईं।
कभी‑कभी मॉडल ऐसी vulnerabilities रिपोर्ट करता था जो वास्तव में exploit‑योग्य नहीं थीं। विशेष रूप से C या C++ जैसी memory‑unsafe भाषाओं में false positives अधिक दिखे। इसलिए अंतिम सत्यापन अभी भी मानव विशेषज्ञों को करना पड़ता है।
एक और दिलचस्प बात यह रही कि मॉडल का सुरक्षा‑आधारित refusal व्यवहार हमेशा समान नहीं था।
कुछ मामलों में यह exploit path पहचान लेने के बाद भी उसे पूरा दिखाने से मना कर देता था, जबकि अन्य मामलों में यह आगे बढ़कर PoC बनाने तक पहुँच गया।
यह दिखाता है कि शक्तिशाली AI क्षमताओं और दुरुपयोग‑रोधी सुरक्षा उपायों के बीच संतुलन बनाना कितना कठिन है।
Cloudflare के परीक्षण से एक बड़ा संकेत मिलता है: AI अब vulnerability research को पूरी तरह बदल सकता है।
रक्षात्मक पक्ष (defenders) के लिए ऐसे सिस्टम:
लेकिन यही क्षमताएँ गलत हाथों में पड़ने पर खतरा भी बढ़ा सकती हैं। यदि AI बग ढूँढने से लेकर exploit तैयार करने तक की पूरी प्रक्रिया स्वचालित कर दे, तो उन्नत साइबर हमले शुरू करना कहीं आसान हो सकता है।
Cloudflare का निष्कर्ष यह था कि भविष्य में सिर्फ तेज़ी से पैच जारी करना पर्याप्त नहीं होगा। संगठनों को vulnerability management के लिए नई रणनीतियाँ अपनानी पड़ सकती हैं, क्योंकि हमलावर भी इसी तरह के AI टूल इस्तेमाल कर सकते हैं।
Claude Mythos Preview एक क्लासिक dual‑use technology का उदाहरण है।
इसी वजह से Mythos Preview को अभी सार्वजनिक रूप से जारी नहीं किया गया है। इसे केवल चुनिंदा संगठनों के साथ Project Glasswing के तहत साझा किया जा रहा है ताकि इसे रक्षात्मक साइबर सुरक्षा परीक्षण में इस्तेमाल किया जा सके।
Cloudflare के प्रयोग से साफ संकेत मिलता है कि AI अब साधारण कोड‑सहायता से आगे बढ़कर पूरे vulnerability discovery और exploit reasoning स्टैक को संभालने की दिशा में बढ़ रहा है—और यही आने वाले वर्षों में साइबर रक्षा और साइबर हमलों दोनों को बदल सकता है।
Comments
0 comments