أطلقت علي بابا جناح Qwen Robot في يونيو 2026، وهو ثلاثي من نماذج الذكاء الاصطناعي يمنح الروبوتات معالجة متقدمة، وملاحة ذاتية، وقدرة على محاكاة الإجراءات المادية المستقبلية وهي نقلة من روبوتات المحادثة إلى وكلاء ماديين... يستخدم نموذج Qwen RobotManip تمثيل حركة موحد بـ 80 بُعدًا لتمكين عتاد روبوتي متنوع من تعلم مهارا...

Create a landscape editorial hero image for this Studio Global article: What is Alibaba’s new Qwen-Robot AI model suite for robotics, what are the roles of Qwen-RobotNav, Qwen-RobotManip, and Qwen-RobotWorld, how. Article summary: In June 2026, Alibaba launched the **Qwen-Robot Suite**, its first suite of AI models for robots, positioning it as a move beyond chatbot-style “digital AI” into embodied intelligence for the physical world [6][7]. The s. Topic tags: general, academic, general web, news, user generated. Reference image context from search candidates: Reference image 1: visual subject "BABA-W (09988.HK) -2.300 (-2.104%)) Short selling $836.00M; Ratio 11.269%) rolled out the Qwen-Robot embodied AI foundation model series, comprising three core models: the VLA man" source context "BABA-W Rolls out Qwen-Robot Embodied AI Foundation Model Series" Reference image 2: visual subject "B
لطالما كانت شركة علي بابا قوة مهيمنة في عالم الذكاء الاصطناعي الرقمي، لكن خطوتها الأخيرة تمثل تحولاً حاسماً نحو العالم المادي. ففي يونيو 2026، أطلق قسم "كوين" (Qwen) في الشركة -المعروف سابقاً بنماذج اللغات الكبيرة مفتوحة المصدر واسعة الانتشار- جناح كوين روبوت (Qwen-Robot Suite). هذه هي أول عائلة من نماذج الذكاء الاصطناعي التي تُبنى خصيصاً للذكاء المُجسَّد، مما يمثل خطوة واضحة تتجاوز روبوتات المحادثة إلى قيادة آلات قادرة على الإدراك والاستنتاج والتصرف في بيئات حقيقية .
تم تطوير هذا الجناح بواسطة مختبر تونغيي (Tongyi Lab) التابع لعلي بابا، وقد دخل بالفعل في برامج تجريبية مع عملاء من الشركات، وهو مصمم ليكون "هيكلاً عالمياً" للروبوتات بمختلف أشكالها وأغراضها . يكمن الابتكار الأساسي في نظام ثلاثي الأجزاء يمنح الروبوت "يداً ماهرة"، و"قدماً ملاحية"، و"عقلاً مفكراً".
تعالج البنية النمطية للجناح التحدي المجزأ المتمثل في بناء ذكاء اصطناعي مادي. فبدلاً من نظام واحد متجانس، تتولى ثلاثة نماذج قدرات منفصلة ولكنها مترابطة.
هذا نموذج رؤية-لغة-فعل (VLA)، مبني على هيكل Qwen3.5-4B، وهو بمثابة محرك المعالجة للجناح . والغرض منه هو ترجمة تعليمات اللغة الطبيعية إلى أفعال مادية دقيقة للأذرع الروبوتية.
يكمن مفتاح مرونته عبر مختلف أنواع العتاد في تمثيل حركة موحد بـ 80 بُعداً، والذي يعمل مثل "لغة جسد" عالمية للآلات . من خلال توحيد تعليمات الحركة وحسابها نسبةً إلى إطار الكاميرا بدلاً من الإحداثيات المطلقة، يستطيع RobotManip التكيف بسرعة مع عتاد جديد بأقل قدر من الضبط - تماماً مثل سائق محترف يتأقلم مع سيارة غير مألوفة
.
هذه المهارة مدعومة بكمية هائلة من البيانات. تم تدريب النموذج مسبقاً على أكثر من 38,100 ساعة من فيديوهات العروض التوضيحية للروبوتات والبشر متاحة المصدر، ويغطي 15 شكلاً آلياً مختلفاً . يهدف هذا التدريب الموحد واسع النطاق إلى حل مشكلة انخفاض الأداء الشائعة عند نقل نموذج روبوتي بين منصات مادية مختلفة
. في اختبارات المقارنة المعيارية، حققت إصداراته المرتبة الأولى والثانية في معدلات نجاح المهام، حيث تعاملت مع مهام معقدة مثل قلي البطاطس المقلية باستخدام ذراعين
.
نموذج Qwen-RobotNav هو نموذج رؤية-لغة-ملاحة (VLN)، مبني على عائلة Qwen3-VL ومتوفر بأحجام 2B و 4B و 8B من المعاملات . إنه بوابة الفعل للوكلاء الماديين المتنقلين، ومهمته منح الروبوتات ذكاءً مكانياً وقدرة على الحركة الذاتية
.
ما يميز Qwen-RobotNav هو توحيده لخمس مهام ملاحية متميزة تحت إطار عمل واحد دون الحاجة لتبديل النماذج. تشمل هذه المهام: اتباع التعليمات، والملاحة نحو نقطة هدف، والملاحة نحو كائن هدف، وتتبع الهدف، والقيادة الذاتية . يستخدم النموذج بروتوكول تشفير ملاحظات قابل للتحكم وواجهة أدوات، مما يسمح له بربط فهم الرؤية-اللغة مباشرة بالتحكم في الحركة
. عملياً، هذا يعني أن الروبوت يمكنه تفسير أمر منطوق مثل "ابحث عن غرفة الاجتماعات في نهاية الممر" بينما يعالج محيطه البصري بشكل ديناميكي للتنقل في أماكن غير مألوفة دون خريطة مبنية مسبقاً
.
القطعة الثالثة، وربما الأكثر استشرافاً للمستقبل في هذا الجناح، هي نموذج العالم القائم على الفيديو والمشروط باللغة، والمبني على محول انتشار متعدد الوسائط (MMDiT) من 60 طبقة مع مشفر Qwen2.5-VL المجمد .
نموذج Qwen-RobotWorld لا يكتفي بالتعرف على المشهد؛ بل يتنبأ بكيفية تغيره. باستخدام اللغة الطبيعية كواجهة فعل موحدة، يقوم بتوليد مسارات بصرية مستقبلية ذات أسس مادية من الملاحظة الحالية للروبوت . يعمل هذا التنبؤ عبر المعالجة الروبوتية، والقيادة الذاتية، والملاحة الداخلية، وحتى سيناريوهات النشاط البشري. تم تدريب النموذج على أكثر من 8.6 مليون زوج تدريب عبر مشاهد متنوعة، ويمكنه محاكاة أكثر من 1,300 مهارة معالجة عبر أكثر من 20 شكلاً آلياً
.
لنموذج العالم هذا قيمة عملية فورية: يمكنه توليد بيانات فيديو اصطناعية للتخفيف من النقص المزمن في البيانات في مجال الذكاء الاصطناعي المُجسَّد، ويمكنه محاكاة عواقب أي فعل قبل أن ينفذه الروبوت في العالم الحقيقي، مما يحسن الدقة والسلامة .
أحد مبادئ التصميم الحاسمة في جناح Qwen-Robot هو مرونة النشر. يمكن تشغيل النماذج بشكل مستقل لوظائف فردية - على سبيل المثال، استخدام Qwen-RobotNav فقط في مركبة توصيل داخل مستودع - أو دمجها في حزمة متكاملة. عندما تعمل معاً، تشكل النماذج الثلاثة نظام حلقة مغلقة حيث يعزز الإدراك (RobotNav و RobotManip) والتنبؤ (RobotWorld) بعضهما البعض، مما يمكن الروبوت من "المشي والرؤية والتفكير" في آن واحد .
هذا النهج المتكامل مرتبط بإحكام مع منظومة نماذج علي بابا الأوسع، بما في ذلك نموذج Qwen3.7-Max الرائد، الذي يتولى تفكيك المهام المعقدة . كما أن اعتماد الجناح التأسيسي على البيانات مفتوحة المصدر وإصدارات النماذج المتاحة للعموم يتناسب تماماً مع استراتيجية علي بابا لاعتماد المطورين على نطاق واسع
.
إن إطلاق Qwen-Robot ليس تجربة مفاجئة. إنه يمثل تتويجاً لمسيرة منهجية متعددة السنوات من الذكاء الاصطناعي الرقمي البحت إلى المجال المادي.
في أكتوبر 2025، أعلن جاستن لين، قائد التكنولوجيا في Qwen، علناً عن تشكيل فريق داخلي متخصص للروبوتات والذكاء الاصطناعي المُجسَّد. وقد وصفه بأنه الخطوة المنطقية التالية لوكلاء الذكاء الاصطناعي، قائلاً إن النماذج متعددة الوسائط "يجب أن تخطو بالتأكيد من العالم الافتراضي إلى العالم المادي" . بعد بضعة أشهر فقط، في فبراير 2026، أطلقت علي بابا نموذج Qwen 3.5، وسوقته صراحةً كنموذج لـ "عصر الذكاء الاصطناعي الوكيل" القادر على تنفيذ مهام معقدة متعددة الخطوات بشكل مستقل
. أصبحت هذه القوة اللغوية والاستنتاجية العمود الفقري المعرفي لنماذج الروبوتات التي أُطلقت في يونيو
.
إلى جانب التطوير الداخلي، قامت علي بابا أيضاً بتحركات خارجية استراتيجية. فقد قادت وحدة الحوسبة السحابية التابعة لها جولة تمويل بقيمة 140 مليون دولار لشركة الروبوتات الناشئة X Square Robot في 2025 . هذه الاستراتيجية متعددة المحاور - البحث والتطوير الداخلي، منظومة نماذج مفتوحة المصدر، والاستثمار في الشركات الناشئة - تضع جناح Qwen-Robot كجزء من طموح أكبر ليكون "مصنع ذكاء اصطناعي" شامل لجيل جديد من الآلات المادية الذكية
.
دخول علي بابا مجال الذكاء الاصطناعي المُجسَّد يضعها في منافسة مباشرة مع شركات مثل إنفيديا (Nvidia)، التي توفر حزمة محاكاة وحوسبة قوية، وعدد متزايد من الشركات الناشئة الأمريكية في هذا المجال. بينما لا تقدم المصادر المتاحة مقارنة أداء مباشر ضد هؤلاء المنافسين، يقدم جناح Qwen-Robot عرض قيمة مميزاً قائماً على التكامل وسهولة الوصول .
الجناح هو أساس نمطي مفتوح مصمم ليتم نشره على عتاد أطراف ثالثة بأقل قدر من التعديل. هذا يتناقض مع الحزمة الاحتكارية المتكاملة رأسياً، مما يضع علي بابا كمورد نماذج محايد لمجموعة من مصنعي الروبوتات. أعظم أصول الشركة هي منظومة Qwen الحالية واسعة النطاق، التي أنتجت مئات النماذج مفتوحة المصدر بأكثر من 600 مليون تراكمي، مما أوجد مجتمع مطورين ضخم يمكنه الآن البناء على أسس الروبوتات هذه .
ومع ذلك، لا يزال هناك مستوى كبير من عدم اليقين. تم الإعلان عن الجناح للتو في يونيو 2026، وتفتقر الوثائق المتاحة إلى مقاييس نشر تجاري واسع النطاق أو بيانات موثوقية طويلة الأجل. لا يزال من غير المعروف كيف ستؤدي هذه النماذج تحت تقلب المهام الصناعية غير المنظمة وطويلة الأمد. الاختبار الحقيقي لطموح علي بابا في الذكاء الاصطناعي المادي سيكون فيما إذا كان توفر هذه النماذج سيترجم إلى اعتماد واسع النطاق من قبل صناعة الروبوتات ككل.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
أطلقت علي بابا جناح Qwen Robot في يونيو 2026، وهو ثلاثي من نماذج الذكاء الاصطناعي يمنح الروبوتات معالجة متقدمة، وملاحة ذاتية، وقدرة على محاكاة الإجراءات المادية المستقبلية وهي نقلة من روبوتات المحادثة إلى وكلاء ماديين...
أطلقت علي بابا جناح Qwen Robot في يونيو 2026، وهو ثلاثي من نماذج الذكاء الاصطناعي يمنح الروبوتات معالجة متقدمة، وملاحة ذاتية، وقدرة على محاكاة الإجراءات المادية المستقبلية وهي نقلة من روبوتات المحادثة إلى وكلاء ماديين... يستخدم نموذج Qwen RobotManip تمثيل حركة موحد بـ 80 بُعدًا لتمكين عتاد روبوتي متنوع من تعلم مهارات مادية موحدة من أكثر من 38,100 ساعة من بيانات المصادر المفتوحة؛ بينما يوحد نموذج Qwen RobotNav خمس مهام ملاحية بما فيها...
بينما يمكن نشر الجناح بشكل مستقل أو كحزمة متكاملة، إلا أن مقاييس التبني في العالم الحقيقي لا تزال غير مثبتة، كما أن المقارنات المباشرة للأداء مع منافسين مثل إنفيديا لم تُوثق بعد.
Loading comments...
Comments
0 comments