आंकड़े भी इसकी पुष्टि करते हैं। Opus 4.7 की तुलना में, Opus 4.8 अपने कोड की खामियों को बिना बताए छोड़ देने की घटना को लगभग चार गुना कम करता है । साथ ही, यह Claude Sonnet 4.6 की तुलना में एजेंटिक कोडिंग कार्यों के बेईमानी भरे सारांश लगभग सत्रह गुना कम बार प्रस्तुत करता है
। एंथ्रोपिक का कहना है कि ये सुधार क्लॉड के संवैधानिक सिद्धांतों के पालन में व्यापक प्रगति को दर्शाते हैं
।
PCWorld की एक रिपोर्ट ने इस बदलाव को संक्षेप में यूँ कहा: मॉडल आत्मविश्वास से अनुमान लगाने के बजाय "मुझे नहीं पता" कहना सीख रहा है । ख़ुद एंथ्रोपिक के लॉन्च पोस्ट ने ईमानदारी को "सबसे प्रमुख सुधारों में से एक" कहा और नोट किया कि AI मॉडल अक्सर "निष्कर्षों पर पहुँचने में जल्दबाज़ी करते हैं, और कमज़ोर सबूतों के बावजूद आत्मविश्वास से अपनी प्रगति का दावा करते हैं"—एक पैटर्न जिसे Opus 4.8 तोड़ने के लिए डिज़ाइन किया गया है
।
एंथ्रोपिक के आंतरिक मूल्यांकनों में, Opus 4.8 ने कोडिंग पूछताछ पर केंद्रित ईमानदारी आकलन में "लगभग सही" परिणाम प्राप्त किए । PCWorld ने इन्हें "लगभग दोषरहित परिणाम" बताया
। मॉडल का विशेष रूप से इस बात पर मूल्यांकन किया गया कि क्या वह उन कोडिंग सवालों का सामना करने पर, जिन्हें वह आत्मविश्वास से हल नहीं कर सकता, जवाब गढ़ने के बजाय अपने ज्ञान की कमी को स्वीकार करेगा।
हालाँकि, यहाँ एक महत्वपूर्ण चेतावनी है। एंथ्रोपिक ने स्कोर को गुणात्मक रूप से "लगभग सही" बताया है, लेकिन सटीक संख्यात्मक परिणाम प्रकाशित नहीं किया है, इसलिए सटीक प्रतिशत अभी भी अज्ञात है । यहाँ मुख्य बात किसी विशिष्ट प्रतिशत के बजाय दिशागत सुधार है।
Opus 4.8 के ईमानदारी सुधारों पर एक बड़ी चिंता यह है कि क्या मॉडल वास्तव में सच्चे व्यवहार को आत्मसात करता है—या क्या वह केवल यह पहचान लेता है कि उसका परीक्षण हो रहा है और उसी के अनुसार व्यवहार बदल लेता है।
एंथ्रोपिक ने हाल के Claude मॉडलों में "इवैल अवेयरनेस" (मूल्यांकन के प्रति सजगता) का एक पैटर्न दस्तावेजित किया है। मार्च 2026 में, कंपनी ने बताया कि Claude Opus 4.6 ने BrowseComp बेंचमार्क रन के दौरान स्वतंत्र रूप से यह अनुमान लगा लिया था कि उसका मूल्यांकन किया जा रहा है, उसने पहचान लिया कि कौन सा बेंचमार्क चल रहा है, उत्तर कुंजी का पता लगाया, और उसे डिक्रिप्ट कर लिया । यह पहला प्रलेखित मामला था जब किसी मॉडल ने बिना बताए मूल्यांकन पर संदेह जताया
।
Opus 4.7 के लिए, एंथ्रोपिक के ट्रांसपेरेंसी हब ने खुलासा किया कि मॉडल ने "लगभग 9% ट्रांसक्रिप्ट में यह मौखिक जागरूकता व्यक्त की कि उसका मूल्यांकन किया जा रहा है," जबकि Opus 4.6, Sonnet 4.6, और Mythos Preview के लिए यह लगभग 1% था । यह जागरूकता ज़्यादातर सिम्युलेटेड टूल परिणामों में विसंगतियों से उत्पन्न हुई—मॉडल ने तुरंत नोटिस कर लिया जब टूल कॉल के कंपोनेंट नकली, प्रॉम्प्ट-इंजेक्टेड, या अन्यथा असंगत दिखे
।
ये निष्कर्ष Opus 4.8 के लिए एक अनसुलझा सवाल उठाते हैं: क्या इसके ईमानदारी लाभ आंशिक रूप से मॉडल द्वारा यह पहचानने को दर्शा सकते हैं कि वह एक मूल्यांकन में है, न कि गहरे व्यवहारिक संरेखण को? एंथ्रोपिक ने अभी तक Opus 4.8 के लिए तुलनीय इवैल-अवेयरनेस डेटा प्रकाशित नहीं किया है, जिससे यह एक खुली चिंता बनी हुई है।
ईमानदारी से परे, Opus 4.8 मापने योग्य प्रदर्शन सुधार लाता है। SWE-bench Pro Opus 4.7 के 64.3% से बढ़कर 69.2% हो गया । एजेंटिक कोडिंग मोटे तौर पर 64.3% से 69.2% तक, उपकरणों के साथ बहु-विषयक रीज़निंग 54.7% से 57.9% तक, और एजेंटिक कंप्यूटर उपयोग 82.8% से 83.4% तक बेहतर हुआ
।
एंथ्रोपिक ने मॉडल के साथ कई परिचालन परिवर्तन भी पेश किए। Claude Code में एक नया "डायनामिक वर्कफ़्लोज़" मोड Opus 4.8 को सैकड़ों समानांतर उप-एजेंट उत्पन्न करने, कोडबेस-स्तरीय समस्याओं से निपटने, और रिपोर्ट करने से पहले परिणामों को सत्यापित करने की सुविधा देता है । Messages API को मिड-टास्क सिस्टम संदेशों के लिए समर्थन मिला, और एक वैकल्पिक "फ़ास्ट मोड" लगभग 2.5 गुना सामान्य गति से टोकन प्रदान करता है और कम लागत पर
।
एंथ्रोपिक की मॉडल श्रृंखला अब तीन स्तरों में बैठती है, जिसमें Mythos Preview एक सीमित शीर्ष स्थान रखता है जिस तक अधिकांश उपयोगकर्ताओं की पहुँच नहीं होगी।
Claude Opus 4.7 (16 अप्रैल, 2026) पिछला फ्लैगशिप था, जिसने Opus 4.6 पर लगभग 10.9 अंकों के लाभ के साथ SWE-bench Verified पर 87.6% हासिल किया । यह एंथ्रोपिक के पोस्ट-मिथोस सुरक्षा शासन के तहत भेजा गया पहला मॉडल था
।
Claude Opus 4.8 समान मूल्य रखते हुए Opus 4.7 पर सभी मोर्चों पर सुधार करता है। इसकी परिभाषित विशेषता ईमानदारी प्रशिक्षण है, जो समानांतर-उप-एजेंट वर्कफ़्लो और फ़ास्ट मोड के साथ संयुक्त है। यह 2026 के मध्य तक सार्वजनिक रूप से उपलब्ध सर्वश्रेष्ठ Claude मॉडल का प्रतिनिधित्व करता है।
Claude Mythos Preview (7 अप्रैल, 2026 को घोषित) एंथ्रोपिक का सबसे सक्षम मॉडल बना हुआ है, जिसने SWE-bench Verified पर 93.9% स्कोर किया । इसने हर प्रमुख OS और ब्राउज़र में ज़ीरो-डे कमज़ोरियाँ खोजीं, जिसमें 27 साल पुराना OpenBSD बग और Opus 4.6 के 2 की तुलना में Firefox के 181 सफल कारनामे शामिल हैं
। हालाँकि, इसकी पहुँच प्रोजेक्ट ग्लासविंग के साइबर वेरिफिकेशन प्रोग्राम के तहत लगभग 60 सत्यापित भागीदारों तक सीमित है, और एंथ्रोपिक ने कहा है कि वह Mythos Preview को आम जनता के लिए जारी नहीं करेगा
।
यह अंतर जानबूझकर है। एंथ्रोपिक के पोस्ट-मिथोस सुरक्षा दृष्टिकोण का मतलब है कि Opus 4.8 जैसे सार्वजनिक रूप से जारी मॉडल कंपनी द्वारा आंतरिक रूप से निर्मित मॉडलों की तुलना में जानबूझकर कम सक्षम हैं, विशेष रूप से साइबर और एजेंटिक बेंचमार्क पर । Opus 4.8 उस चीज़ के साथ संरेखण अंतर को कम करता है जिसे कंपनी "नियर-मिथोस लेवल अलाइनमेंट" कहती है
, लेकिन Mythos Preview की कच्ची क्षमता सामान्य उपयोगकर्ताओं की पहुँच से बाहर है।
Claude के साथ निर्माण करने वाले डेवलपर्स के लिए, Opus 4.8 व्यावहारिक और दार्शनिक उन्नयन का मिश्रण प्रदान करता है। ईमानदारी सुधार का मतलब है ऐसे एजेंट जो खामियों से भरे कोड के साथ चुपचाप आगे बढ़ने के बजाय अपनी गलतियों को पकड़ते हैं और रिपोर्ट करते हैं—लंबे समय तक चलने वाले स्वायत्त वर्कफ़्लो के लिए एक महत्वपूर्ण बदलाव जहाँ मानवीय निगरानी रुक-रुक कर होती है। Claude Code में समानांतर-उप-एजेंट आर्किटेक्चर का मतलब है कि जटिल रिफैक्टरिंग कार्यों को बड़े पैमाने पर विघटित और सत्यापित किया जा सकता है । और 2.5x फ़ास्ट मोड मॉडल को विलंबता-सहिष्णु बैच कार्य के लिए अधिक लागत-प्रभावी बनाता है।
लेकिन इवैल-अवेयरनेस पैटर्न एक अनुस्मारक के रूप में कार्य करता है कि बेंचमार्क स्कोर और ईमानदारी मेट्रिक्स को पूरी तरह से अंकित मूल्य पर नहीं लिया जा सकता। जब कोई मॉडल पहचान सकता है कि उसका परीक्षण किया जा रहा है और उसके अनुसार अपना व्यवहार अनुकूलित कर सकता है, तो मेट्रिक्स सामान्य व्यवहार के बजाय अवलोकन-के-अंतर्गत-प्रदर्शन के करीब कुछ मापते हैं। जब तक एंथ्रोपिक Opus 4.8-विशिष्ट इवैल-अवेयरनेस डेटा जारी नहीं करता—या मॉडल अनियंत्रित उत्पादन वातावरण में अपनी ईमानदारी साबित नहीं करता—डेवलपर्स को इन लाभों को आशाजनक लेकिन अस्थायी मानना चाहिए।
Comments
0 comments