تأتي هذه النتائج استمراراً لزخم كبير من مختبر الصوت في 'تشوين'. فنماذج سابقة مثل Fun-Realtime-ASR وFun-Realtime-AudioChat كانت قد حصدت المراكز الأولى على المنصة نفسها .
لم تتوقف إنجازات نماذج الصوت من علي بابا عند هذا الحد، بل تفوقت أيضاً على منافسين غربيين مثل OpenAI وxAI في اختبارات تتعامل مع اللهجات والنبرات الإقليمية، وخصوصاً اللهجات الصينية المعقدة، محققة تفوقاً تقنياً واضحاً .
بشكل منفصل، كان نموذج Qwen3.5-Omni-Plus - الذي صدر في مارس 2026 - قد أفاد بتحقيق 215 نتيجة هي الأفضل في فئتها (SOTA) عبر مهام فهم الصوت والفيديو. في اختبارات صوتية مستقلة، تفوق هذا النموذج على Gemini 3.1 Pro من Google في فهم الصوت العام، والاستدلال، والترجمة، لكنه تعادل معه في الفهم الشامل للصوت والصورة . ويشير تحليل تقني مدقق إلى أن الانتصارات في المجال الصوتي حقيقية - حيث سجل النموذج الصيني معدل خطأ في التعرف على الكلام بلغ 6.55% مقابل 7.32% لنموذج Gemini - لكنه يتخلف عن Gemini بنحو 12 نقطة في اختبار المهام التفاعلية متعددة الخطوات (OmniGAIA)
.
أطلقت علي بابا نموذج Qwen3.7-Max في 19 مايو 2026، وخلال أسبوع واحد ظهر في المركز الرابع على منصة Code Arena لتطوير الويب (WebDev) بتصنيف إيلو بلغ 1,541، بفارق نقطة واحدة خلف Claude Opus 4.6 Thinking ومتقدماً على جميع النماذج من OpenAI وGoogle . أما في مسار برمجة React تحديداً، فارتقى النموذج إلى المركز الثالث عالمياً بتصنيف 1,536 إيلو
، بل وأشارت بعض المصادر إلى وصوله إلى المركز الثاني في بعض التصنيفات الفرعية
.
ما يجعل هذا الإنجاز لافتاً هو أن شركة Anthropic بنماذجها Claude Opus 4.7/4.6 كانت تحتكر المراكز من الأول إلى الثالث، مما يعني أن علي بابا كانت المطور الوحيد من خارج الولايات المتحدة - والمختبر الوحيد غير الأمريكي - الذي يقتحم المراتب الخمس الأولى في البرمجة، متقدماً بذلك على نماذج مثل GPT-5.5 وGemini 3.5 Flash في مهام برمجية واقعية تقيّم تفضيلات البشر في سير عمل تطويري متعدد الخطوات .
يقدم تقرير مؤشر ستانفورد 2026 لمحة عن تصنيفات إيلو لساحة النماذج اعتباراً من مارس 2026، والتي تظهر تكدساً واضحاً في المقدمة :
| المختبر | تصنيف Arena Elo |
|---|---|
| Anthropic | 1,503 |
| xAI | 1,495 |
| 1,494 | |
| OpenAI | 1,481 |
| علي بابا (Alibaba) | 1,449 |
| DeepSeek | 1,424 |
تحتل علي بابا المركز الخامس عالمياً، بفارق يتراوح بين 50 و55 نقطة عن المتصدر. هذا الفارق الضئيل جعل مؤلفي التقرير يصفون الضغط التنافسي الحالي بأنه تحول من التفوق الخام في القدرات إلى منافسة شرسة على التكلفة، والموثوقية، والأداء في المجالات المتخصصة بدلاً من مجرد القدرات العامة .
تأتي هذه النتائج القياسية في عام شهد تقلص فجوة الأداء بين أفضل النماذج الأمريكية والصينية إلى درجة التلاشي تقريباً. فقد وجد مؤشر ستانفورد للذكاء الاصطناعي 2026 أن الفجوة انهارت من نطاق 17.5–31.6 نقطة مئوية في مايو 2023 إلى 2.7% فقط بحلول مارس 2026. البلدان الآن 'يتبادلان باستمرار المراكز الأولى في صدارة اختبارات القياس' - وهو تحول حاد عن الحقبة التي هيمنت فيها أمريكا حتى عام 2024 .
حدث هذا على الرغم من أن الولايات المتحدة تنفق على استثمارات الذكاء الاصطناعي الخاصة ما يفوق إنفاق الصين بنحو 23 ضعفاً - 285.9 مليار دولار مقابل 12.4 مليار دولار في أحدث فترة تم تتبعها .
يشير المحللون إلى عدة قوى تقف وراء عملية اللحاق الصينية السريعة:
لكن من المهم الإشارة إلى أن بعض التقييمات الأخرى لا تزال ترى فجوة أوسع. إذ يجادل تحليل لمعهد بروكينغز (Brookings) في 2026 بأن النماذج الأمريكية المتطورة لا تزال تتقدم على نظيراتها الصينية 'بأشهر عدة أو أكثر'، وأن المختبرات الأمريكية تحتفظ بتفوق في حجم القدرة الحاسوبية والمهام التفاعلية طويلة الأمد . كما تطرح شهادة أمام الكونغرس في الفترة نفسها رأياً مشابهاً
.
مع ذلك، فإن النتيجة العملية للشركات والمطورين واضحة: مزيد من المنافسة، وتيرة أسرع للابتكار، أسعار أقل، وخيارات عملية أكثر من مقدمي خدمات أمريكيين وصينيين على حد سواء .
Comments
0 comments