उत्तरप्रकाशित2 माह पहलेLast edited पिछला माह23 स्रोत

Qwen3.7‑Max: अलीबाबा का AI मॉडल जो लंबे समय तक खुद काम करने वाले एजेंट्स के लिए बनाया गया है

Qwen3.7‑Max अलीबाबा का नया फ्लैगशिप AI मॉडल है, जिसे स्वायत्त AI एजेंट्स के लिए बनाया गया है जो कई घंटों या दिनों तक जटिल काम कर सकते हैं। रिपोर्ट के अनुसार, एक डेमो में मॉडल ने 35 घंटे तक खुद काम करते हुए 1,000 से अधिक टूल कॉल्स के साथ कर्नेल ऑप्टिमाइज़ेशन किया। प्रारंभिक बेंचमार्क में इसका Artificial Analysis Inte...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

Concept illustration of Alibaba’s Qwen3.7‑Max AI model executing autonomous agent tasks — What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agenticQwen3.7‑Max is designed as a foundation model for AI agents capable of performing long‑running, multi‑step tasks.
AI संकेत
Create a landscape editorial hero image for this Studio Global article: What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agentic. Article summary: Alibaba’s Qwen3.7-Max is a new flagship Qwen large language model positioned less as a chatbot and more as an “agent-era” model: it is built for coding, tool use, reasoning, office automation, and long-running autonomous. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Alibaba launches Qwen3-Max, its largest and most capable AI model to date. **Alibaba has released Qwen3-Max, the biggest and most capable AI model in its lineup. The new model is" source context "Alibaba launches Qwen3-Max, its largest and most capable AI ..." Reference image 2: visual subject "# Alibaba
openai.com

आर्टिफिशियल इंटेलिजेंस का अगला चरण सिर्फ सवालों के जवाब देने वाले चैटबॉट्स का नहीं, बल्कि खुद काम करने वाले AI एजेंट्स का माना जा रहा है। इसी दिशा में अलीबाबा ने अपना नया फ्लैगशिप मॉडल Qwen3.7‑Max पेश किया है।

2026 में Alibaba Cloud Summit में पेश किया गया यह मॉडल खास तौर पर उन सिस्टम्स के लिए बनाया गया है जो लंबे और जटिल कामों को स्वायत्त रूप से योजना बनाकर पूरा कर सकें—जैसे कोड लिखना, उसे डिबग करना, बाहरी टूल्स का उपयोग करना और कई चरणों वाली वर्कफ़्लो प्रक्रियाएँ चलाना।

यह बदलाव AI उद्योग के बड़े ट्रेंड को दिखाता है: AI अब केवल टेक्स्ट या जवाब बनाने तक सीमित नहीं है, बल्कि सीधे काम करने वाली मशीनें बनने की ओर बढ़ रहा है।

Qwen3.7‑Max क्या है

Qwen3.7‑Max, अलीबाबा की Qwen बड़ी‑भाषा‑मॉडल श्रृंखला का नया संस्करण है। इसे खास तौर पर agentic workloads यानी ऐसे कामों के लिए बनाया गया है जहाँ AI को समस्या को छोटे‑छोटे हिस्सों में तोड़ना, टूल्स का उपयोग करना और कई चरणों में समाधान तक पहुँचना होता है।

अलीबाबा के अनुसार इस मॉडल की मुख्य क्षमताएँ शामिल हैं:

जटिल समस्याओं के लिए उन्नत reasoning
कोड लिखना और डिबग करना
बाहरी टूल्स और APIs के साथ काम करना
सैकड़ों या हजारों चरणों वाली लंबी प्रक्रियाएँ चलाना

दूसरे शब्दों में, यह मॉडल सिर्फ बातचीत करने के लिए नहीं बल्कि काम पूरा करने के लिए बनाया गया है।

लंबे समय तक स्वायत्त काम करने की क्षमता

Qwen3.7‑Max का सबसे चर्चित उदाहरण उसका एक आंतरिक प्रयोग है जिसमें मॉडल ने लगभग 35 घंटे तक लगातार काम किया।

रिपोर्ट के अनुसार इस प्रयोग में AI ने:

एक कर्नेल ऑप्टिमाइज़ेशन समस्या पर काम किया
1,000 से अधिक टूल कॉल्स किए
खुद कोड लिखा
टेस्ट चलाए
परिणामों का विश्लेषण किया और सुधार किए

यह पूरा चक्र बार‑बार दोहराया गया जब तक बेहतर समाधान नहीं मिला।

यह प्रक्रिया आमतौर पर इस तरह काम करती है:

लक्ष्य को समझना
उसे छोटे कार्यों में विभाजित करना
कोड या कार्रवाई तैयार करना
टूल्स या परीक्षण चलाना
परिणामों के आधार पर सुधार करना

इतनी लंबी अवधि तक लगातार तार्किक रूप से काम करना भाषा मॉडलों के लिए कठिन होता है, इसलिए ऐसे डेमो उल्लेखनीय माने जाते हैं—हालाँकि ये परिणाम अभी मुख्यतः कंपनी की रिपोर्टिंग पर आधारित हैं।

बेंचमार्क और प्रदर्शन

प्रारंभिक मूल्यांकन बताते हैं कि Qwen3.7‑Max वैश्विक स्तर पर मजबूत AI मॉडलों की श्रेणी में आता है, हालांकि कुछ शीर्ष मॉडलों से थोड़ा पीछे भी है।

Artificial Analysis Intelligence Index

Artificial Analysis के संयुक्त बेंचमार्क में Qwen3.7‑Max का स्कोर लगभग 57 बताया गया है, जो इसे वर्तमान AI मॉडलों के शीर्ष स्तर के करीब रखता है।

इसी इंडेक्स में OpenAI, Google और Anthropic जैसे प्रयोगशालाओं के कुछ मॉडल थोड़े अधिक स्कोर भी हासिल करते हैं।

LM Arena रैंकिंग

क्राउडसोर्स्ड LM Arena leaderboard पर Qwen3.7‑Max‑Preview ने लगभग 1,475 Elo स्कोर हासिल किया और टेक्स्ट क्षमताओं में लगभग 13वाँ वैश्विक स्थान पाया।

कुछ उप‑रैंकिंग इस प्रकार बताई गई हैं:

गणितीय तर्क: लगभग #7
विशेषज्ञ प्रश्न / जटिल प्रॉम्प्ट: लगभग #9
कोडिंग: लगभग #10

रिलीज़ के समय यह Arena leaderboard में सबसे उच्च‑रैंक वाला चीनी AI मॉडल भी माना गया।

कोडिंग और AI एजेंट वर्कफ़्लो में ताकत

Qwen3.7‑Max को खास तौर पर coding‑focused AI agent के रूप में प्रस्तुत किया गया है।

संभावित उपयोगों में शामिल हैं:

कई फाइलों वाले सॉफ्टवेयर प्रोजेक्ट विकसित करना
कोड डिबग करना और ऑप्टिमाइज़ करना
GPU या कर्नेल स्तर का ऑप्टिमाइज़ेशन
ऑटोमेटेड टेस्टिंग और पुनरावृत्ति

इस मॉडल को ऐसे टूल्स के साथ काम करने के लिए डिज़ाइन किया गया है जैसे कंपाइलर, इंटरप्रेटर, API और डेवलपमेंट एनवायरनमेंट—जिससे AI बार‑बार कोड बदलकर उसे टेस्ट कर सके।

लंबा कॉन्टेक्स्ट और बड़े डेटा पर काम

Qwen मॉडल श्रृंखला लंबे context window के लिए जानी जाती है, जिससे मॉडल एक ही बार में बड़े दस्तावेज़, कोडबेस या डेटा पढ़ सकता है।

कुछ संबंधित Qwen मॉडलों में कॉन्टेक्स्ट सीमा सैकड़ों हजार से लगभग 10 लाख टोकन तक बताई गई है।

हालाँकि Qwen3.7‑Max के लिए आधिकारिक अधिकतम कॉन्टेक्स्ट सीमा अभी स्पष्ट रूप से पुष्टि नहीं हुई है, इसलिए अक्सर बताए जाने वाले 1‑मिलियन टोकन दावे को सावधानी से देखना चाहिए।

वास्तविक दुनिया में उपयोग

अलीबाबा इस मॉडल को एंटरप्राइज़ AI एजेंट प्लेटफ़ॉर्म के रूप में देखता है, जिसका उपयोग कई क्षेत्रों में हो सकता है।

सॉफ्टवेयर डेवलपमेंट

स्वचालित कोड जनरेशन
डिबगिंग और रिफैक्टरिंग
बड़े कोडबेस का विश्लेषण
हार्डवेयर या कर्नेल ऑप्टिमाइज़ेशन

ऑफिस और उत्पादकता

दस्तावेज़ संपादन और सारांश
मल्टी‑स्टेप ऑफिस वर्कफ़्लो
बिज़नेस प्रोसेस ऑटोमेशन

एंटरप्राइज़ संचालन

डेटा विश्लेषण
ग्राहक सेवा ऑटोमेशन
ऑपरेशंस और मैनेजमेंट वर्कफ़्लो

इन सभी मामलों में AI केवल टेक्स्ट नहीं बनाता—बल्कि कार्य की योजना बनाता है, टूल्स का उपयोग करता है और लक्ष्य पूरा करने के लिए कई चरणों की कार्रवाई करता है।

वैश्विक AI प्रतिस्पर्धा में स्थिति

चीन के AI इकोसिस्टम में Qwen3.7‑Max को लॉन्च के समय सबसे सक्षम मॉडलों में से एक माना गया है, और कुछ बेंचमार्क में यह अन्य चीनी मॉडलों से आगे बताया गया है।

लेकिन वैश्विक स्तर पर प्रतिस्पर्धा और भी कड़ी है। कुछ संयुक्त बेंचमार्क में OpenAI, Google और Anthropic के अग्रणी मॉडल अभी भी थोड़ा बेहतर प्रदर्शन करते हैं।

यह स्थिति AI उद्योग के व्यापक परिदृश्य को दिखाती है—जहाँ विभिन्न कंपनियाँ reasoning, coding, लागत‑प्रभावशीलता और agent क्षमताओं में तेजी से प्रतिस्पर्धा कर रही हैं।

बड़ा बदलाव: चैटबॉट से एजेंट तक

Qwen3.7‑Max का असली महत्व केवल उसके बेंचमार्क स्कोर में नहीं है।

असल बदलाव यह है कि AI अब सिर्फ जवाब देने वाले सिस्टम से आगे बढ़कर काम करने वाले एजेंट बन रहे हैं। ऐसे सिस्टम:

कई चरणों वाली योजना बना सकते हैं
सॉफ्टवेयर टूल्स से बातचीत कर सकते हैं
लंबे समय तक लगातार काम कर सकते हैं
परिणाम मिलने तक बार‑बार सुधार कर सकते हैं

Qwen3.7‑Max इसी दिशा का एक स्पष्ट उदाहरण है—एक ऐसा मॉडल जो बातचीत से ज्यादा वास्तविक काम पूरा करने के लिए बनाया गया है।

भले ही इसके सबसे महत्वाकांक्षी डेमो (जैसे कई घंटों तक चलने वाली स्वायत्त कोडिंग प्रक्रिया) को व्यापक स्वतंत्र परीक्षणों में और पुष्टि की जरूरत हो, लेकिन एक बात साफ है: AI का अगला चरण स्वायत्त एजेंट्स का युग हो सकता है।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं