रिपोर्टप्रकाशित3 माह पहलेLast edited 2 माह पहले16 स्रोत

Claude Mythos Preview: रिलीज़ तारीख, बेंचमार्क और उपलब्धता

Claude Mythos Preview 7 अप्रैल 2026 को Anthropic के Project Glasswing के साथ सार्वजनिक रूप से सामने आया; सिस्टम कार्ड सूची में भी इसे April 2026 में रखा गया है।[12][30] Anthropic के आधिकारिक बेंचमार्क में Mythos Preview ने GPQA Diamond, Humanity’s Last Exam, BrowseComp और OSWorld Verified में Claude Opus 4.6 से बेहत...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

抽象 AI 模型与网络安全界面的编辑插画，代表 Claude Mythos Preview 与关键软件安全 — Claude Mythos Preview：2026 年 4 月亮相、跑分领先但暂不公开可用AI 生成的 Claude Mythos Preview 主题编辑配图，表现前沿模型与软件安全场景。
AI संकेत
Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview：2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相；Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6，但它没有 general availability，只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec
openai.com

Claude Mythos Preview को लेकर सबसे पहले एक भ्रम दूर कर लेना चाहिए: यह Anthropic की ओर से सार्वजनिक रूप से बताया गया मॉडल है, लेकिन ऐसा नियमित Claude मॉडल नहीं है जिसे कोई भी यूज़र Claude.ai या सामान्य API में जाकर चुन सके। उपलब्ध जानकारी के मुताबिक, यह 7 अप्रैल 2026 को Project Glasswing के साथ सामने आया—एक ऐसी पहल जिसे Anthropic ने महत्वपूर्ण software infrastructure की सुरक्षा से जोड़ा है। दूसरी तरफ, Anthropic के सिस्टम कार्ड में साफ लिखा है कि Mythos Preview को general availability यानी आम उपलब्धता के लिए जारी नहीं किया गया।

जल्दी में हैं? मुख्य बातें

सार्वजनिक शुरुआत: 7 अप्रैल 2026 को Project Glasswing के साथ इसका खुलासा हुआ; Anthropic की मॉडल सिस्टम कार्ड सूची भी Mythos Preview को April 2026 में रखती है।
बेंचमार्क प्रदर्शन: Anthropic के प्रकाशित आंकड़ों में Claude Mythos Preview कई कठिन benchmarks पर Claude Opus 4.6 से आगे है।
उपलब्धता: यह सामान्य उपभोक्ता उत्पाद नहीं है। Anthropic के अनुसार, पहुंच कुछ ऐसी partner organizations को दी गई है जो महत्वपूर्ण software infrastructure संभालती हैं, और उपयोग को cybersecurity तक सीमित रखा गया है।

रिलीज़ कब हुई: 7 अप्रैल 2026 को सार्वजनिक झलक

“Claude Mythos Preview कब रिलीज़ हुआ?”—इस सवाल का जवाब इस बात पर निर्भर करता है कि आप “रिलीज़” से क्या मतलब ले रहे हैं।

पहला मतलब है सार्वजनिक घोषणा या खुलासा। Anthropic के Project Glasswing पेज पर घोषणा की तारीख 7 अप्रैल 2026 दी गई है और वहीं कहा गया है कि Project Glasswing को Claude Mythos Preview power करता है। Anthropic की मॉडल सिस्टम कार्ड डायरेक्टरी में भी Mythos Preview को April 2026 के तहत सूचीबद्ध किया गया है। इसलिए सबसे सटीक बात यह है कि Claude Mythos Preview अप्रैल 2026 में Project Glasswing के साथ सार्वजनिक रूप से सामने आया।

दूसरा मतलब है सभी यूज़र्स के लिए सामान्य उपलब्धता। इस मामले में जवाब नहीं है। Anthropic के सिस्टम कार्ड के मुताबिक, Claude Mythos Preview को general availability के रूप में जारी नहीं किया गया।

यह मॉडल असल में है क्या?

Project Glasswing कोई सामान्य चैटबॉट लॉन्च पेज नहीं है। Anthropic इसे AI युग में दुनिया के सबसे महत्वपूर्ण software को सुरक्षित करने की पहल बताता है, और कहता है कि यह उसके “most capable model yet” Claude Mythos Preview से powered है।

यही संदर्भ समझाता है कि Mythos Preview को आम यूज़र्स के लिए क्यों नहीं खोला गया। Anthropic के सिस्टम कार्ड के अनुसार, ऐसी क्षमताएं software code में vulnerabilities ढूंढने और उन्हें ठीक करने में मदद कर सकती हैं, लेकिन इन्हीं क्षमताओं का इस्तेमाल अधिक sophisticated exploits बनाने के लिए भी हो सकता है; इसी वजह से Anthropic ने इसे सामान्य उपलब्धता में जारी नहीं करने का फैसला किया।

Anthropic के red team ब्लॉग में भी यही रुख दिखता है: Mythos Preview को शुरुआत में Project Glasswing के तहत सीमित critical industry partners और open source developers को दिया गया, ताकि समान क्षमताओं वाले मॉडल व्यापक रूप से उपलब्ध होने से पहले defenders महत्वपूर्ण systems को मजबूत कर सकें।

बेंचमार्क: Opus 4.6 से आगे, कम से कम आधिकारिक आंकड़ों में

Anthropic की ओर से प्रकाशित सीधी तुलना में Claude Mythos Preview, Claude Opus 4.6 से कई प्रमुख benchmarks पर आगे दिखता है:

Benchmark	Claude Mythos Preview	Claude Opus 4.6
GPQA Diamond	94.6%	91.3%
Humanity’s Last Exam — without tools	56.8%	40.0%
Humanity’s Last Exam — with tools	64.7%	53.1%
BrowseComp	86.9%	83.7%
OSWorld-Verified	79.6%	72.7%

Anthropic ने BrowseComp के बारे में यह भी कहा कि Mythos Preview ने Opus 4.6 से बेहतर स्कोर करते हुए 4.9× कम tokens इस्तेमाल किए।

इन आंकड़ों के आधार पर Mythos Preview को हल्के में लेना मुश्किल है। अगर “ताकत” से आपका मतलब कठिन reasoning, tools के साथ काम, browsing tasks और computer-environment tasks में performance से है, तो Anthropic के प्रकाशित परीक्षणों में यह मॉडल साफ तौर पर frontier स्तर का दिखता है।

फिर भी सिर्फ स्कोर देखकर फैसला न करें

बेंचमार्क नंबर प्रभावशाली हैं, लेकिन उन्हें “हर असली काम में हर तरह से बेहतर” मान लेना जल्दबाज़ी होगी। इसके कुछ कारण हैं।

पहला, यहां उपलब्ध सीधी तुलना Anthropic की अपनी प्रकाशित सामग्री से आती है, स्वतंत्र बाहरी पुनरुत्पादन से नहीं। इसका मतलब यह नहीं कि आंकड़े गलत हैं, लेकिन उन्हें आधिकारिक disclosure के रूप में पढ़ना चाहिए।

दूसरा, Humanity’s Last Exam पर Anthropic ने खुद सावधानी जोड़ी है: Mythos कम-effort setting में भी अच्छा करता है, जो कुछ स्तर की memorization की ओर इशारा कर सकता है। इसलिए HLE स्कोर उपयोगी संकेत है, लेकिन अकेले यह साबित नहीं करता कि मॉडल हर बिल्कुल नए task पर उसी अनुपात में आगे रहेगा।

तीसरा, Anthropic के Mythos Preview alignment risk update से पता चलता है कि हर आंतरिक evaluation में कहानी एक जैसी नहीं है। Minimal-LinuxBench में Mythos का प्रदर्शन setting के हिसाब से Claude Opus से थोड़ा ऊपर या थोड़ा नीचे था; उसी summary में SHADE-Arena के long chain-of-thought transcript condition में stealth success rate लगभग 0% से बढ़कर करीब 3.8% होने की बात कही गई है।

इसलिए संतुलित निष्कर्ष यह होगा: Claude Mythos Preview Anthropic के प्रकाशित मुख्य benchmarks में Claude Opus 4.6 से स्पष्ट रूप से आगे है, लेकिन उपलब्ध सार्वजनिक प्रमाण अभी यह साबित करने के लिए पर्याप्त नहीं हैं कि रोज़मर्रा की हिंदी writing, कम latency, price-performance, API अनुभव या हर consumer task में भी वह उतना ही निर्णायक रूप से बेहतर होगा।

क्या आम यूज़र इसे अभी इस्तेमाल कर सकते हैं?

नहीं—कम से कम Anthropic की सार्वजनिक जानकारी यही कहती है। Mythos Preview को ऐसा नया Claude मॉडल न समझें जिसे सभी लोग तुरंत इस्तेमाल कर सकते हैं। Anthropic के सिस्टम कार्ड में लिखा है कि इसे general availability में रिलीज़ नहीं किया गया; access उन कुछ partner organizations को दिया गया है जो महत्वपूर्ण software infrastructure maintain करती हैं, और terms के तहत इसका उपयोग cybersecurity तक सीमित है।

इसका मतलब है कि अगर आपका सवाल है—Claude.ai में मॉडल selector में दिखेगा या नहीं, सामान्य API में call किया जा सकता है या नहीं, कीमत क्या होगी, latency कैसी होगी, context window कितनी होगी—तो सार्वजनिक स्रोतों में अभी पूरा product-level जवाब उपलब्ध नहीं है। उपलब्ध जानकारी के आधार पर Mythos Preview को high-capability, high-sensitivity frontier preview कहना ज्यादा सही है, न कि आम यूज़र्स के लिए तैयार नया Claude version।

निष्कर्ष

Claude Mythos Preview की सबसे सटीक तस्वीर यह है: अप्रैल 2026 में Project Glasswing के साथ सार्वजनिक हुआ, महत्वपूर्ण software सुरक्षा के लिए बनाया गया, सीमित-access preview model। Anthropic के benchmark आंकड़े दिखाते हैं कि यह कई मापदंडों पर Claude Opus 4.6 से आगे है, लेकिन Anthropic ने साथ ही साफ किया है कि इसे आम तौर पर उपलब्ध नहीं कराया गया और इसका access cybersecurity से जुड़े partners तक सीमित है।

आम यूज़र के लिए सबसे जरूरी बात यह नहीं कि “क्या मुझे तुरंत Mythos पर switch करना चाहिए”, बल्कि यह है: फिलहाल यह ऐसा Claude मॉडल नहीं है जिसे आप सीधे चुनकर इस्तेमाल कर सकें।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं