呢次成績徹底改寫咗頂尖編程 AI 由兩間美國公司玩晒嘅遊戲規則。佢清楚咁發出咗一個信號:中國嘅 AI 實驗室,而家已經有能力產出足以喺實際軟件開發任務中一較高下嘅模型。Qwen3.7-Max 嘅急速崛起,其實只係成個 AI 編程競賽大趨勢嘅一部分,包括月之暗面(Moonshot)嘅 Kimi K2.5 等模型,近期都已經打入咗全球頭十名 。
雖然 Qwen3.7-Max 喺 Code Arena 嘅成績最搶眼,但佢喺其他領域嘅表現同樣唔失禮。喺「Design Arena」排行榜上,Qwen3.7-Max 都攞到 第十名 嘅耀眼成績,顯示出佢喺多模態評估方面都有返咁上下實力,絕對唔止得編程叻 。另外,呢個模型仲被形容為結合咗強大嘅推理能力,而且支援長時間嘅自主任務,可以連續工作 35 個鐘頭,調用超過 1,000 次工具
。
對於開發者同企業嚟講,呢個趨勢嘅訊號好清晰:下一代 AI 編程助手嘅選擇,已經唔再局限於單一地區或者公司。阿里巴巴嘅 Qwen3.7-Max,已經成功將自己擺咗喺「值得為實際軟件工程流程進行基準測試」嘅前沿模型頭號名單之上。
Comments
0 comments