समुदाय के अनुमान 15 जून से 5 जुलाई, 2026 के बीच एक संभावित रिलीज़ विंडो की ओर इशारा करते हैं, लेकिन यह समय-सीमा पूरी तरह से लॉग में दिखे संकेतों से निकाला गया अनुमान है और इसका कोई आधिकारिक समर्थन नहीं है । इस काल्पनिक GPT‑5.6 के लिए कोई ठोस मूल्य निर्धारण, टोकन-दक्षता संख्या, या पुष्ट मल्टीमॉडल क्षमताएं सामने नहीं आई हैं; बेहतर लागत-प्रभावशीलता और टेक्स्ट-प्लस-इमेज जनरेशन की उम्मीद 5.x परिवार की राह से निकाला गया अनुमान है, कोई प्रलेखित विशिष्टता नहीं
।
निचली पंक्ति: GPT‑5.6 एक विश्वसनीय लीक है, कोई उत्पाद नहीं। उद्योग बैकएंड व्यवहार पर नज़र रखे हुए है, लेकिन OpenAI द्वारा कोई लॉन्च तिथि या तकनीकी विशिष्टता पत्र प्रकाशित नहीं किया गया है ।
“मिथोस बेंचमार्क” वाक्यांश कई अलग-अलग संदर्भों में सामने आता है, जो भ्रम पैदा कर सकता है:
एंथ्रोपिक का क्लॉड मिथोस मॉडल लीक (26 मार्च, 2026): एंथ्रोपिक की सामग्री प्रबंधन प्रणाली में एक गलत कॉन्फ़िगरेशन ने गलती से लगभग 3,000 आंतरिक दस्तावेज़ों को उजागर कर दिया, जिसमें “कैपीबारा” कोडनेम वाली एक अगली पीढ़ी के मॉडल का मसौदा पोस्ट शामिल था, जिसे आधिकारिक तौर पर क्लॉड मिथोस नाम दिया गया । लीक हुए आंतरिक बेंचमार्क ने दिखाया कि मिथोस ने SWE‑बेंच वेरिफाइड पर 93.9% और SWE‑बेंच प्रो पर 77.8% स्कोर किया, जो उस समय हर प्रमुख कोडिंग बेंचमार्क में अग्रणी था
। 7 अप्रैल, 2026 को, एंथ्रोपिक ने औपचारिक रूप से क्लॉड मिथोस प्रीव्यू की घोषणा की—लेकिन साथ ही यह भी घोषित कर दिया कि जनता इसका उपयोग नहीं कर सकती
। मॉडल को असाधारण साइबर सुरक्षा क्षमताओं के लिए भी चिह्नित किया गया है, जिसमें OpenBSD में 27 साल पुरानी बग ढूंढना शामिल है
।
कार्नेगी मेलन विश्वविद्यालय का सुरक्षा बेंचमार्क (मई 2026): CMU के शोधकर्ताओं ने एक अलग मूल्यांकन बनाया जो यह परखता है कि क्या AI मॉडल Google के V8 इंजन को लक्षित करके स्वायत्त रूप से वास्तविक ब्राउज़र शोषण विकसित कर सकते हैं। क्लॉड मिथोस और GPT‑5.5 दोनों बिना मानवीय हस्तक्षेप के वास्तविक सुरक्षा खामियों को खोजने और उन्हें हथियार बनाने में सक्षम साबित हुए, जिसमें मिथोस ने GPT‑5.5 से महत्वपूर्ण अंतर से बेहतर प्रदर्शन किया, जबकि इसे चलाने में लगभग बारह गुना अधिक लागत आई ।
सिक्योरएआई का मिथोस भेद्यता बेंचमार्क (जनवरी 2026): 2023–2026 के CVE को कवर करने वाला एक साइबर सुरक्षा-केंद्रित बेंचमार्क सूट, जो AI भेद्यता डिटेक्टरों का मूल्यांकन करने के लिए डिज़ाइन किया गया है, और जो Llama‑3.1‑405B जैसे बड़े मॉडलों को आधार रेखा के रूप में उपयोग करता है ।
जब कोई “मिथोस बेंचमार्क लीक” का ज़िक्र करता है, तो वे आमतौर पर एंथ्रोपिक मॉडल लीक की बात कर रहे होते हैं। CMU और सिक्योरएआई बेंचमार्क अलग-अलग प्रयास हैं जो केवल संयोग से “मिथोस” लेबल साझा करते हैं।
2 जून, 2026 को, अपने “इंटेलिजेंस एट वर्क” इवेंट में, OpenAI ने कोडेक्स के एक संरचनात्मक विस्तार की घोषणा की, इसे एक डेवलपर-केंद्रित कोडिंग एजेंट से एक व्यापक एंटरप्राइज कार्य मंच में बदल दिया । घोषणा के तीन पुष्ट स्तंभ हैं:
OpenAI ने यह भी पुष्टि की कि कोडेक्स ने 50 लाख साप्ताहिक सक्रिय उपयोगकर्ताओं का आंकड़ा पार कर लिया है । यह विस्तार उद्यम के अंदर गैर-डेवलपर ज्ञान कर्मियों को लुभाने के एक स्पष्ट रणनीतिक कदम का प्रतिनिधित्व करता है, एक ऐसी दिशा जिसे कई स्वतंत्र विश्लेषणों ने उन उपकरणों के खिलाफ प्रत्यक्ष प्रतिस्पर्धी धुरी के रूप में पहचाना है जो पहले लगभग विशेष रूप से इंजीनियरिंग टीमों पर केंद्रित थे
।
2 जून, 2026 को सैन फ्रांसिस्को में अपने वार्षिक बिल्ड सम्मेलन में, Microsoft ने नए हार्डवेयर के साथ, एकीकृत MAI (Microsoft AI) ब्रांड के तहत सात इन-हाउस AI मॉडलों का एक परिवार पेश किया ।
इसका केंद्रबिंदु है MAI‑थिंकिंग‑1, कंपनी का पहला रीज़निंग मॉडल:
अन्य छह मॉडल एक मल्टीमॉडल इकोसिस्टम को पूरा करते हैं:
हार्डवेयर घोषणाओं में सरफेस RTX स्पार्क डेव बॉक्स शामिल था, जो 128 GB एकीकृत मेमोरी के साथ एक पेटाफ्लॉप तक की AI गणना करने में सक्षम एक कॉम्पैक्ट AI डेवलपमेंट मशीन है, जिसे स्थानीय रूप से 120 बिलियन पैरामीटर तक के मॉडल चलाने के लिए डिज़ाइन किया गया है । Microsoft ने Majorana 2 क्वांटम चिप भी पेश की, जो शास्त्रीय AI गणना से परे अपनी हार्डवेयर महत्वाकांक्षाओं में तेजी का संकेत देती है
।
सात-मॉडल वाले MAI परिवार की व्यापक रूप से व्याख्या OpenAI मॉडलों पर निर्भरता कम करने के एक कदम के रूप में की जा रही है, साथ ही एंटरप्राइज ग्राहकों को इन-हाउस विकल्प दिए जा रहे हैं जो साफ वाणिज्यिक लाइसेंसिंग के साथ आते हैं ।
“वाइब कोडिंग”—सिंटैक्स लिखने के बजाय संवादात्मक प्रॉम्प्ट के माध्यम से संपूर्ण एप्लिकेशन तैयार करने की प्रथा—ने बेंचमार्क की एक नई पीढ़ी को जन्म दिया है जो अलग-थलग कोडिंग कार्यों के बजाय फुल-स्टैक क्षमता को मापने का प्रयास करती है:
ये तीनों प्लेटफ़ॉर्म AI कोडिंग मूल्यांकन को SWE‑बेंच जैसे पास-रेट बेंचमार्क से आगे ले जाकर उपयोगिता, गति, लागत और सुरक्षा के समग्र उपायों की ओर बढ़ाने का लक्ष्य साझा करते हैं।
2 जून, 2026 को, Nous Research ने हर्मीस एजेंट v0.15.2 के साथ बंडल करके और MIT लाइसेंस के तहत macOS 12+, Windows 10/11 और Linux के लिए एक सार्वजनिक पूर्वावलोकन के रूप में हर्मीस डेस्कटॉप जारी किया ।
हर्मीस पहले केवल कमांड-लाइन इंटरफ़ेस या मैसेजिंग गेटवे के माध्यम से पहुँच योग्य था। डेस्कटॉप ऐप एक मूल ग्राफिकल फ्रंट-एंड है जो CLI के समान एजेंट कोर, API कुंजी, सत्र, कौशल और मेमोरी साझा करता है, इसलिए यह एक फोर्क के बजाय एक वैकल्पिक सतह है ।
Nous Research हर्मीस को “एक स्व-सुधार करने वाला एजेंट, कोडिंग कोपायलट नहीं” के रूप में वर्णित करता है । यह एजेंट लॉन्च से लेकर लगभग तीन महीनों में लगभग 1,80,000 GitHub स्टार्स तक बढ़ गया है, जो इसे इकोसिस्टम में सबसे तेजी से बढ़ने वाली ओपन-सोर्स एजेंट परियोजनाओं में से एक बनाता है
।
अलीबाबा ने लगभग 1-2 जून, 2026 को क्वेन 3.7 प्लस लॉन्च किया। यह एक मल्टीमॉडल एजेंट मॉडल है जो अर्ली-फ्यूजन प्रशिक्षण के माध्यम से टेक्स्ट, इमेज और वीडियो को प्रोसेस करता है, जिसमें 10 लाख टोकन की संदर्भ विंडो है ।
मूल्य निर्धारण अलीबाबा के केवल-टेक्स्ट क्वेन 3.7 मैक्स की प्रति-टोकन लागत का लगभग छठा हिस्सा निर्धारित किया गया है, जो इसे बाजार में सबसे आक्रामक रूप से मूल्य निर्धारित मल्टीमॉडल एजेंटों में से एक बनाता है । एजेंट-प्रदर्शन बेंचमार्क पर, क्वेन 3.7 प्लस टर्मिनल-बेंच 2.0 पर क्लॉड ओपस 4.6 को हराता है और UI पहचान/स्वचालन, इमेज से कोड जनरेशन और विजुअल प्रश्न उत्तर देने में सक्षम है
।
क्लॉड कोड एंथ्रोपिक का एजेंटिक कोडिंग टूल है जो सीधे टर्मिनल में काम करता है, डेवलपर की मशीन पर शेल कमांड चलाता है और फाइलों को संपादित करता है। /fork कमांड एक नया सत्र बनाता है जो मौजूदा सत्र से शाखा लेता है, जिसे commands/branch/ के तहत संग्रहीत किया जाता है, एक ऐसा वर्कफ़्लो सक्षम करता है जहां डेवलपर्स मूल सत्र से संदर्भ खोए बिना एक अलग दिशा का पता लगा सकते हैं ।
क्लॉड कोड सबसे व्यापक रूप से अपनाए गए AI डेवलपर उपकरणों में से एक बन गया है, एक npm-पैकेज उल्लेख ने एक ही दिन में 1,100 से अधिक स्टार और 1,900 फोर्क जमा कर लिए ।
मूल पूछताछ में कई आइटम ऐसे हैं जिनकी जून 2026 की शुरुआत तक प्रत्यक्ष स्रोत पुष्टि नहीं है:
जून 2026 के पहले सप्ताह के प्रमुख विषय हैं एंटरप्राइज टूलिंग (कोडेक्स प्लगइन्स और साइट्स), इन-हाउस मॉडल परिवार (Microsoft की MAI लाइनअप, अलीबाबा की क्वेन), ओपन-सोर्स एजेंट परिपक्वता (हर्मीस डेस्कटॉप), और एक मंडराती अगली पीढ़ी जो अभी सार्वजनिक नहीं है (GPT‑5.6, क्लॉड मिथोस)। उद्योग तेजी से आगे बढ़ रहा है—लेकिन पुष्ट उत्पादों और अपुष्ट अफवाहों के बीच का अंतर सुर्खियों के सुझाव से कहीं अधिक तीखा है।
Comments
0 comments