這個模型之所以能適應各種硬體,關鍵在於它採用了一套80維度的統一動作表徵。這套表徵就像機器人之間的通用「肢體語言」,讓它們能學習基礎的物理規律與動作邏輯 。同時,Qwen-RobotManip捨棄了以繁瑣的絕對座標來計算動作,而是以攝影機畫面爲基準進行相對操作運算。這代表它能快速適應各種新硬體,只需微調幾步,就像一個經驗豐富的老司機,試踩幾下油門就能熟悉一輛陌生的車
。
這份靈巧有強大的數據庫做後盾。Qwen-RobotManip的預訓練資料涵蓋了超過38,100小時的開源機器人及人類示範影片,遍及15種不同的機器人形態 。這種大規模的統一訓練,就是爲了解決過去機器人模型只要換到不同平臺,效能就會大幅下滑的老問題
。在基準測試中,不同版本的Qwen-RobotManip不僅在任務成功率上名列前茅,甚至能處理像「雙手協作翻動薯條」這類高難度的複雜任務
。
Qwen-RobotNav是一個視覺-語言-導航(VLN)模型,建構在Qwen3-VL家族之上,提供2B、4B和8B三種不同參數大小的版本 。它是實體行動裝置的「行動入口」,負責賦予機器人空間智慧與自主移動的能力
。
有別於傳統的導航系統,Qwen-RobotNav的獨到之處在於,它在單一框架下統一了五種截然不同的導航任務,包含了指令跟隨、定點導航、目標物導航、目標追蹤,以及自動駕駛 。換句話說,機器人不必在不同的任務之間切換模型。它藉由可控制的觀察編碼協定與工具介面,直接將視覺語言理解與運動控制連結起來
。這意味着一臺機器人能夠理解像「找到走廊盡頭的會議室」這樣的口語指令,同時動態處理它所看到的環境,在沒有預先繪製地圖的陌生空間中也能自主導航
。
Qwen-RobotWorld不只是辨識場景,它還能預測場景將會如何改變。它將自然語言當成一個統一的行動介面,根據機器人當下的觀察,生成未來一連串合乎物理世界規則的視覺軌跡 。這種預測能力橫跨機器人操作、自動駕駛、室內導航,甚至到人類活動等各種場景。這個模型使用了超過860萬組跨場景的訓練資料對進行訓練,能模擬超過1,300種操作技能,適用於20種以上的機器人形態
。
這個世界模型的實際價值在於雙重功能:一來,它可以生成大量的合成影片數據,用來緩解具身智慧領域長期以來的數據短缺問題;二來,它能在機器人於真實世界執行動作「之前」,就先模擬出該動作可能導致的後果,進而提升操作的精準度與安全性 。
Qwen-Robot系列的設計原則,在於極高的部署彈性。它們可以獨立運行,執行單一任務——例如,在一臺倉庫送貨機器人中只使用Qwen-RobotNav來負責導航;也可以整合成一個完整的系統。當三個模型協同運作時,會形成一個閉環系統:負責感知的RobotNav和RobotManip,以及負責預測的RobotWorld,彼此會互相增強,讓機器人真正實現「邊走、邊看、邊思考」的能力 。
這種全棧式的做法,也與阿里巴巴更廣泛的模型生態系統緊密結合,包括能處理複雜任務分解的旗艦版Qwen3.7-Max代理模型 。此外,這個系列深度依賴開源數據,並對外公開模型,這也完全符合阿里巴巴追求大規模開發者採用的策略
。
Qwen-Robot的推出並非一時興起的實驗,而是阿里巴巴多年來從純數位AI一步步向實體世界進軍的成果展現。
時間回到2025年10月,千問的技術負責人林俊暘(Justin Lin)就公開宣佈,已於內部成立一個專門的機器人與具身AI團隊。他將此舉視爲AI代理人的下一個必然發展,直言多模態模型「絕對應該從虛擬世界跨入物理世界」 。短短幾個月後,阿里巴巴在2026年2月推出Qwen 3.5,並將它定位爲「代理型AI時代」的模型,能夠自主處理複雜的多步驟任務
。這個強大的語言與推論能力,成爲同年6月推出的機器人模型的認知骨幹
。
除了內部研發,阿里巴巴對外也進行了策略性的佈局。旗下的阿里雲在2025年領投了中國機器人新創公司「X Square Robot」一輪1.4億美元的募資 。這種多管齊下的策略——內部研發、開源模型生態系,加上新創投資——讓Qwen-Robot系列成爲一個更宏大野心的一部分:成爲新世代實體智慧機器的全方位「AI工廠」
。
阿里巴巴一腳踏入具身AI領域,將直接與一些強大的競爭者交鋒,例如提供了完整模擬與運算技術堆疊的Nvidia,以及美國爲數衆多的新創公司。雖然目前公開的資料中,還沒有Qwen-Robot系列與這些競爭對手的直接效能比較,但它確實提出了一個基於整合性與開放性的獨特價值主張 。
Qwen-Robot是一套開放、模組化的基礎模型,設計上就是要部署在第三方的硬體上,而且不需要太多客製化的調整。這和完全封閉、垂直整合的系統形成強烈對比,也讓阿里巴巴的角色更像是衆多機器人制造商的「中立模型供應商」。它目前最大的資產,就是那個已經相當龐大的Qwen生態系——至今已產出數百個開源模型,累積下載量超過6億次,形成了一個龐大的開發者社羣,而這個社羣現在可以以此爲基礎,進一步開發各種機器人應用 。
不過,目前仍有很大的不確定性。這個系列在2026年6月才剛剛發表,現有的文件中缺乏大規模商業部署的實際數據,以及長期運作的可靠性資訊。我們還不知道這些模型在面對高度不確定、長時間的複雜工業任務時,表現會是如何。阿里巴巴的實體AI夢想能否成真,最終的考驗將是:這些模型的問世,是否能真正促使其被廣大的機器人產業所採用。
Comments
0 comments