Claude Mythos Preview पर बहस का असली सवाल यह नहीं है कि यह नाम मौजूद है या नहीं। Anthropic की system card इसे एक नया बड़े भाषा मॉडल और frontier AI model बताती है, जिसकी क्षमताओं में software engineering, reasoning और cybersecurity शामिल हैं।[16] ब्रिटेन के AI Security Institute यानी AISI ने भी इसके साइबर आकलन में CTF चुनौतियों और multi-step cyber-attack simulations पर सुधार दर्ज किया।[
25]
लेकिन इसे अभी पूरी तरह स्वतंत्र रूप से साबित हो चुका automated super-hacker कहना जल्दबाज़ी होगी। ‘हज़ारों उच्च-गंभीरता ज़ीरो-डे’ वाला सबसे तेज़ दावा Anthropic के दावों और उन्हें दोहराती रिपोर्टों से आता है, जबकि Tom’s Hardware ने पूछा है कि इन खामियों में कितनी सचमुच exploit हो सकती हैं, कितनी गंभीर हैं और गिनती का तरीका कितना ठोस है।[26][
27]
पहले साफ़ निष्कर्ष: नज़रअंदाज़ भी नहीं, देवत्व भी नहीं
Claude Mythos Preview को एक गंभीर, उच्च-महत्त्व वाली साइबर सुरक्षा क्षमता के preview की तरह समझना बेहतर है—न कि सामान्य Claude चैट में जोड़े गए किसी साधारण फीचर की तरह। उपलब्ध सार्वजनिक सामग्री तीन बातें अपेक्षाकृत मजबूती से बताती है: यह Anthropic द्वारा वर्णित frontier model है; नियंत्रित साइबर सुरक्षा परीक्षणों में इसकी क्षमता बढ़ी है; और इसे आम जनता के लिए सामान्य रूप से उपलब्ध नहीं कराया गया है।[16][
25][
26][
32]
इसके साथ ही, सार्वजनिक सबूत अभी इतना मजबूत नहीं है कि कहा जा सके कि इसने वास्तविक दुनिया में, स्थिर रूप से और स्वतंत्र रूप से जाँचे जा सकने वाले तरीके से हज़ारों high-severity zero-day vulnerabilities खोजकर exploit कर दी हैं। ज़्यादा सावधान निष्कर्ष यह है कि Mythos Preview AI-आधारित vulnerability discovery में बड़ा कदम हो सकता है, लेकिन उसके सबसे सनसनीखेज दावों को और खुली जाँच, स्पष्ट severity grading और तीसरे पक्ष की पुष्टि की जरूरत है।[25][
27]
Claude Mythos Preview आखिर है क्या?
Anthropic की system card के मुताबिक Claude Mythos Preview कंपनी का नया large language model है और उसे frontier AI model के रूप में रखा गया है। उसी दस्तावेज़ में इसकी क्षमता software engineering, reasoning और cybersecurity जैसे क्षेत्रों में बताई गई है।[16]
इसलिए इसे किसी third-party prompt role, plugin या आम Claude project template की तरह समझना ठीक नहीं होगा। सार्वजनिक सामग्री में यह Anthropic द्वारा वर्णित मॉडल है, और साइबर सुरक्षा को उसकी मुख्य क्षमता-सीमा में शामिल किया गया है।[16]
यहीं से असली सवाल शुरू होता है: अगर ऐसा मॉडल सचमुच गंभीर software vulnerabilities खोज सकता है, तो इसकी क्षमता की जाँच कैसे हो, किसे access मिले, खोजी गई खामियों का disclosure कैसे हो और दुरुपयोग कैसे रोका जाए। सार्वजनिक रिपोर्टों के अनुसार Anthropic ने इसे आम public release के बजाय सीमित साझेदारी वाले रास्ते पर रखा है।[26][
32]
क्या यह सचमुच zero-day vulnerabilities अपने आप ढूँढ सकता है?
इसका जवाब दो हिस्सों में है: कंपनी का दावा और बाहरी रूप से उपलब्ध सबूत।
New York Times ने रिपोर्ट किया कि Anthropic के अधिकारियों के अनुसार Claude Mythos Preview autonomous security research कर सकता है, जिसमें critical software में zero-day vulnerabilities को scan और exploit करना शामिल है। रिपोर्ट में zero-day को ऐसी खामी बताया गया है जिसके बारे में software developer तक को पता नहीं होता।[1]
The Hacker News ने भी Anthropic के दावे को रिपोर्ट किया कि Mythos Preview ने major operating systems और web browsers में हज़ारों high-severity zero-day vulnerabilities खोजी हैं।[26]
ये दावे गंभीर हैं, लेकिन इन्हें अंतिम सत्य की तरह पढ़ना सही नहीं होगा। Tom’s Hardware ने इसी दावे पर सवाल उठाते हुए लिखा कि सार्वजनिक जानकारी से यह स्पष्ट नहीं है कि ये vulnerabilities कितनी वास्तविक हैं, इनमें से कितनी exploit नहीं हो सकतीं, या वे वास्तव में कितनी समस्या पैदा करती हैं।[27]
इसलिए सबसे संतुलित उत्तर यह है: हाँ, उपलब्ध संकेत बताते हैं कि Mythos Preview vulnerability discovery से जुड़े कार्यों में काफी मजबूत हुआ है; लेकिन ‘हज़ारों उच्च-गंभीरता ज़ीरो-डे’ वाला दावा अभी पूरी तरह सार्वजनिक और स्वतंत्र रूप से सत्यापित मान लेना ठीक नहीं है।[25][
27]
AISI की जाँच ने क्या साबित किया—और क्या नहीं?
ब्रिटेन के AI Security Institute ने 13 अप्रैल 2026 को प्रकाशित आकलन में कहा कि उसने Anthropic के Claude Mythos Preview का cybersecurity capabilities के लिए मूल्यांकन किया। AISI ने CTF challenges में continued improvement और multi-step cyber-attack simulations में significant improvement पाया।[25]
यह इसलिए अहम है क्योंकि CTF, यानी Capture the Flag, साइबर सुरक्षा की नियंत्रित चुनौतियाँ होती हैं जहाँ प्रतिभागी या सिस्टम तय वातावरण में खामियाँ खोजते और हल करते हैं। ऐसी जाँच यह दिखा सकती है कि मॉडल नियंत्रित attack-defense tasks में बेहतर हुआ है।[25]
लेकिन AISI की रिपोर्ट को उसके दायरे में ही पढ़ना चाहिए। CTF और simulations में सुधार यह साबित नहीं करता कि Anthropic द्वारा बताए गए हर वास्तविक दुनिया के vulnerability claim मौजूद, गंभीर, exploit-able और सार्वजनिक रूप से review किए जा चुके हैं।[25][
27]
Anthropic ने इसे आम लोगों के लिए क्यों नहीं खोला?
रिपोर्टों में वजह लगभग एक जैसी है: ऐसी क्षमता defense के लिए उपयोगी हो सकती है, लेकिन गलत हाथों में जाए तो उसका दुरुपयोग भी हो सकता है। The Hacker News के अनुसार Anthropic ने Mythos Preview को generally available नहीं किया क्योंकि इसकी cybersecurity capabilities और potential misuse को लेकर चिंता है।[26]
NBC News ने भी रिपोर्ट किया कि Anthropic ने Mythos Preview को public release से रोककर रखा और इसे tech giants और partners के सीमित समूह के साथ साझा किया, ताकि वे अपनी सुरक्षा मजबूत कर सकें।[32]
इसका मतलब है कि Mythos Preview की बहस सिर्फ मॉडल की ताकत तक सीमित नहीं है। बराबर महत्त्व के सवाल हैं: access किसे मिलेगा, auditing कैसे होगी, outputs की पुष्टि कौन करेगा, vulnerabilities का responsible disclosure कैसे होगा और अगर कोई दुरुपयोग करे तो रोकथाम क्या होगी।[26][
32]
Project Glasswing की भूमिका क्या है?
WIRED के अनुसार Project Glasswing Apple, Google और 45 से ज़्यादा संगठनों को साथ ला रहा है, ताकि Claude Mythos Preview के जरिए बढ़ती AI cybersecurity capabilities को test किया जा सके।[30]
सार्वजनिक रिपोर्टों के आधार पर यह आम उपयोगकर्ताओं के लिए product launch से ज्यादा एक सीमित, defense-oriented collaboration दिखता है। अगर कोई मॉडल critical software में खामियाँ तेजी से खोज सकता है, तो पहले उन संगठनों को शामिल करना जो ऐसे software को maintain करते हैं, सीधे सार्वजनिक release से सुरक्षित रास्ता हो सकता है।[30][
32]
फिर भी, उपलब्ध रिपोर्टें access criteria, audit rules, vulnerability disclosure workflow और misuse response की पूरी तस्वीर नहीं देतीं। इसलिए Project Glasswing को governance की अंतिम और पूर्ण व्यवस्था मान लेना भी जल्दबाज़ी होगी।[30][
32]
असली ताकत सिर्फ मॉडल में नहीं, agent setup में भी है
Anthropic की red.anthropic.com पर दी गई method note एक महत्वपूर्ण बात बताती है: ज्यादा विविध bugs खोजने और Claude की कई copies को parallel चलाने के लिए हर agent को project की अलग file पर focus कराया गया। duplicate discoveries घटाने और efficiency बढ़ाने के लिए Claude से पहले files को 1 से 5 के scale पर rank कराया गया कि किस file में ‘interesting bugs’ होने की संभावना कितनी है।[8]
यानी publicly दिखाई गई vulnerability discovery capability शायद सिर्फ एक chat box में पूछे गए सवाल का नतीजा नहीं है। यह एक pipeline की तरह काम करती दिखती है: पहले files की risk ranking, फिर multiple agents की parallel review, फिर duplicate results कम करने की कोशिश।[8]
साइबर सुरक्षा teams के लिए यही बात सबसे ज्यादा मायने रखती है। भविष्य का जोखिम सिर्फ powerful base model से नहीं, बल्कि base model + agents + parallel search strategy + tool use जैसे पूरे system combination से आ सकता है।[8]
अभी क्या पक्का कहा जा सकता है?
- Claude Mythos Preview Anthropic की सार्वजनिक system card में वर्णित नया large language model और frontier AI model है।[
16]
- उसकी बताई गई क्षमताओं में software engineering, reasoning और cybersecurity शामिल हैं।[
16]
- AISI ने इसके CTF challenges और multi-step cyber-attack simulations में सुधार दर्ज किया।[
25]
- सार्वजनिक रिपोर्टों के अनुसार Anthropic ने इसे आम जनता के लिए सामान्य रूप से उपलब्ध नहीं कराया।[
26][
32]
- Project Glasswing के तहत Apple, Google और 45 से ज़्यादा संगठनों के साथ testing और collaboration की रिपोर्ट है।[
30]
- Anthropic की method note से पता चलता है कि vulnerability discovery में multiple Claude copies, agent-level file assignment और file risk ranking जैसी orchestration techniques का इस्तेमाल हुआ।[
8]
कहाँ सावधानी जरूरी है?
- ‘हज़ारों vulnerabilities’ को अपने-आप ‘हज़ारों exploit-able high-severity zero-days’ नहीं मानना चाहिए। Tom’s Hardware ने इसी बिंदु पर exploitability, severity और counting method को लेकर सवाल उठाए हैं।[
27]
- AISI की evaluation मजबूत संकेत देती है, लेकिन वह सभी real-world vulnerability claims की पूर्ण स्वतंत्र पुष्टि नहीं है।[
25][
27]
- capability को केवल base model की बुद्धिमत्ता से जोड़ना अधूरा होगा, क्योंकि Anthropic ने parallel agents और file ranking वाले workflow का भी वर्णन किया है।[
8]
- limited release से misuse risk खत्म हो गया, ऐसा मानने का आधार अभी सार्वजनिक रूप से पूरा नहीं दिखता। रिपोर्टें सीमित sharing और Project Glasswing का जिक्र करती हैं, पर governance details पूरी तरह सामने नहीं हैं।[
30][
32]
कंपनियों और security teams के लिए इसका मतलब
आम उपयोगकर्ता के लिए सबसे सीधी बात यह है कि Claude Mythos Preview कोई ऐसा Claude product नहीं दिखता जिसे सामान्य chat model की तरह खोलकर इस्तेमाल किया जा सके। रिपोर्टों के मुताबिक Anthropic ने इसे public release के बजाय सीमित partners तक रखा है।[26][
32]
Security teams के लिए असली संकेत बड़ा है: AI systems अब automated vulnerability search, parallel code review और multi-step attack simulation जैसे कामों में गंभीर स्तर तक पहुँच रहे हैं। उपलब्ध AISI evaluation और Anthropic की method note इसी दिशा की ओर इशारा करते हैं।[8][
25]
इसका मतलब यह नहीं कि human security researchers कल से अप्रासंगिक हो जाएँगे। लेकिन यह जरूर बताता है कि organizations को AI-assisted vulnerability discovery, responsible disclosure, patch prioritization और incident response speed को अब ज्यादा गंभीरता से देखना होगा।[25][
32]
एक पंक्ति में निष्कर्ष: Claude Mythos Preview AI-powered cybersecurity automation का महत्वपूर्ण मोड़ हो सकता है, लेकिन सार्वजनिक सबूत अभी ‘क्षमता बहुत बढ़ी है’ को ज्यादा मजबूती से समर्थन देते हैं, न कि ‘हर हाई-प्रोफाइल ज़ीरो-डे दावा पूरी तरह स्वतंत्र रूप से साबित हो चुका है’ को।[16][
25][
27]




