ये नतीजे Qwen वॉयस लैब के एक व्यापक प्रयास के बाद आए हैं। इससे पहले Fun-Realtime-ASR और Fun-Realtime-AudioChat मॉडल्स ने पहले ही उसी प्लेटफॉर्म पर शीर्ष स्थान का दावा किया था, और Qwen2.5-Omni-7B 0.741 के स्कोर के साथ वॉयसबेंच औसत लीडरबोर्ड का नेतृत्व करता है ।
अलीबाबा के वॉयस मॉडल्स ने क्षेत्रीय-उच्चारण और बोली बेंचमार्क पर ओपनएआई और xAI सहित पश्चिमी प्रतिद्वंद्वियों को भी हराया है, खासकर जटिल चीनी बोलियों में एक विशेष बढ़त के साथ ।
अलग से, Qwen3.5-Omni-Plus—जो मार्च 2026 में जारी किया गया—ने ऑडियो और ऑडियो-विज़ुअल अंडरस्टैंडिंग कार्यों में 215 अत्याधुनिक परिणाम दर्ज किए। स्वतंत्र ऑडियो बेंचमार्क पर, इसने सामान्य ऑडियो अंडरस्टैंडिंग, रीज़निंग और अनुवाद में गूगल के जेमिनी 3.1 प्रो से बेहतर प्रदर्शन किया, हालांकि इसने व्यापक ऑडियो-विज़ुअल कॉम्प्रिहेंशन में केवल जेमिनी की बराबरी की । एक मापी गई तकनीकी समीक्षा बताती है कि ऑडियो जीत वास्तविक हैं—फ़्लर्स ASR बेंचमार्क पर 6.55% शब्द त्रुटि दर बनाम जेमिनी की 7.32%—लेकिन यह मॉडल ओम्नीGAIA एजेंटिक बेंचमार्क पर जेमिनी से लगभग 12 अंक पीछे है
।
अलीबाबा ने Qwen3.7-Max को 19 मई, 2026 को शिप किया, और एक हफ्ते के भीतर यह 1,541 के एलो के साथ कोड एरिना के WebDev लीडरबोर्ड पर चौथे नंबर पर दिखाई दिया, जो क्लॉड ओपस 4.6 थिंकिंग से एक अंक पीछे और ओपनएआई और गूगल के हर मॉडल से आगे था । रिएक्ट कोडिंग ट्रैक पर, यह 1,536 एलो के साथ तीसरे नंबर पर पहुंच गया, जो केवल दो क्लॉड ओपस वेरिएंट से पीछे था
।
एंथ्रोपिक की क्लॉड ओपस 4.7/4.6 लाइन ने WebDev पर एक से तीन स्थान पर कब्जा किया, जिसका मतलब है कि कोडिंग टॉप-5 में सेंध लगाने वाला अलीबाबा, एंथ्रोपिक से इतर एकमात्र डेवलपर था—और एकमात्र गैर-अमेरिकी लैब । यह मॉडल एजेंटिक वेब डेवलपमेंट कार्यों पर GPT-5.5, जेमिनी 3.5 फ्लैश और GLM-5.1 से आगे है, जो मल्टी-स्टेप कोडिंग वर्कफ़्लो पर वास्तविक दुनिया की मानवीय पसंद को स्कोर करते हैं
।
कोड एरिना से परे, Qwen मॉडल्स अन्य कोडिंग और रीज़निंग बेंचमार्क पर प्रतिस्पर्धी परिणाम दे रहे हैं:
स्टैनफोर्ड 2026 AI इंडेक्स का मार्च 2026 तक का एरिना एलो स्नैपशॉट दिखाता है कि शीर्ष लैब्स एक साथ कसकर बंधी हुई हैं :
| लैब | एरिना एलो |
|---|---|
| एंथ्रोपिक | 1,503 |
| xAI | 1,495 |
| गूगल | 1,494 |
| ओपनएआई | 1,481 |
| अलीबाबा | 1,449 |
| डीपसीक | 1,424 |
अलीबाबा कुल मिलाकर 5वें स्थान पर है, लीडर से लगभग 50-55 अंक पीछे। यह इतना करीब है कि रिपोर्ट के लेखक प्रतिस्पर्धी दबाव को कच्ची क्षमता के बजाय लागत, विश्वसनीयता और डोमेन-विशिष्ट प्रदर्शन की ओर स्थानांतरित होने के रूप में वर्णित करते हैं ।
ये बेंचमार्क परिणाम एक ऐसे वर्ष में आए हैं जब बेहतरीन अमेरिकी और चीनी AI मॉडल्स के बीच प्रदर्शन का अंतर लगभग गायब हो गया है। स्टैनफोर्ड का 2026 AI इंडेक्स पाता है कि यह अंतर मई 2023 में 17.5–31.6 प्रतिशत अंक से गिरकर मार्च 2026 तक केवल 2.7% रह गया। दोनों देश अब "बेंचमार्क के शीर्ष पर लगातार एक-दूसरे से स्थान बदल रहे हैं"—जो 2024 तक अमेरिका के वर्चस्व वाले युग से एक तीव्र प्रस्थान है ।
ऐसा इसके बावजूद हुआ जब अमेरिका निजी AI निवेश पर चीन से लगभग 23 गुना अधिक खर्च कर रहा है—ट्रैक की गई सबसे हालिया अवधि में $285.9 बिलियन बनाम $12.4 बिलियन ।
विश्लेषक इस पकड़ के पीछे कई ताकतों की ओर इशारा करते हैं:
यह ध्यान देने योग्य है कि अन्य आकलन एक व्यापक अंतर देखते हैं। 2026 का एक ब्रुकिंग्स विश्लेषण तर्क देता है कि अमेरिकी सीमांत मॉडल अभी भी चीनी मॉडलों से "कई महीने या अधिक" आगे हैं और अमेरिकी लैब्स के पास कंप्यूट पैमाने और लंबी-अवधि वाले एजेंटिक कार्यों पर बढ़त बनी हुई है । उसी अवधि की कांग्रेस की गवाही भी एक समान बिंदु बनाती है
।
फिर भी, उद्यमों और डेवलपर्स के लिए व्यावहारिक नतीजा स्पष्ट है: अधिक प्रतिस्पर्धा, तेज़ पुनरावृत्ति, कम कीमतें, और अमेरिकी और चीनी दोनों प्रदाताओं से अधिक व्यवहार्य विकल्प ।
Comments
0 comments