ผลทดสอบ benchmark ที่ถูกอ้างถึงในสื่อจีนระบุว่าโมเดลมีผลงานโดดเด่นในชุดทดสอบสำหรับ coding agent เช่น SWE‑Pro และ SWE‑Multilingual รวมถึงได้คะแนน 69.7 ใน Terminal Bench 2.0‑Terminus ซึ่งสูงกว่าหลายโมเดลคู่แข่งในชุดทดสอบดังกล่าว
โมเดลยังถูกออกแบบให้รองรับ workflow ที่ซับซ้อน เช่น
แนวคิดนี้สะท้อนแนวโน้มใหม่ของอุตสาหกรรม AI ที่กำลังเปลี่ยนจาก “ผู้ช่วยตอบคำถาม” ไปสู่ ผู้ร่วมงานดิจิทัลที่ทำงานแทนมนุษย์ได้หลายขั้นตอน
Alibaba ยังเน้นความสามารถของ Qwen3.7‑Max ในการทำงานแบบอัตโนมัติเป็นเวลานาน
ในการทดลองหนึ่งที่นำเสนอในงาน โมเดลสามารถ ทำงานต่อเนื่องประมาณ 35 ชั่วโมง โดยมีการเรียกใช้เครื่องมือมากกว่า 1,000 ครั้ง และยังคงรักษาการให้เหตุผลอย่างต่อเนื่องตลอดกระบวนการ
ในกรณีทดสอบนั้น AI ได้ปรับปรุง kernel สำหรับระบบ inference ของ AI บนแพลตฟอร์มชิปใหม่ของ Alibaba และทำให้ความเร็วเพิ่มขึ้น ประมาณ 10 เท่า เมื่อเทียบกับเวอร์ชันเดิม
ความสามารถในการทำงานระยะยาวแบบนี้เป็นองค์ประกอบสำคัญของวิสัยทัศน์ AI agent ที่สามารถทำงานหลายร้อยหรือหลายพันขั้นตอนโดยแทบไม่ต้องมีมนุษย์ควบคุม
รายงานจากสื่อจีนที่อ้างข้อมูลการทดสอบแบบ blind test ของ Arena leaderboard ระบุว่า Qwen3.7‑Max อยู่ในอันดับ หนึ่งของโมเดลที่พัฒนาในจีน และมีประสิทธิภาพใกล้เคียงกับโมเดลชั้นนำจาก OpenAI, Anthropic และ Google
อย่างไรก็ตาม ผลลัพธ์ benchmark เหล่านี้เป็นข้อมูลจากรายงานภายนอกและควรตีความด้วยความระมัดระวังจนกว่าจะมีการตรวจสอบซ้ำอย่างอิสระ
นอกจากโมเดลแล้ว Alibaba ยังเปิดตัวโครงสร้างพื้นฐาน AI ใหม่หลายรายการ
รายละเอียดสำคัญที่รายงานในงาน ได้แก่
โครงสร้างพื้นฐานเหล่านี้จะให้บริการผ่านแพลตฟอร์ม Alibaba Cloud Bailian เพื่อรองรับทั้งการฝึกโมเดล (training) และการประมวลผลใช้งานจริง (inference) สำหรับลูกค้าองค์กร
ผู้บริหาร Alibaba ระบุว่าการเปิดตัวครั้งนี้เป็นส่วนหนึ่งของยุทธศาสตร์ระยะยาวในการสร้างระบบ AI แบบครบวงจร
ในงานประชุม Liu Weiguang รองประธานอาวุโสของ Alibaba Cloud อธิบายว่าอนาคตของ AI จะคล้ายกับการผลิตในโรงงาน โดยมี “โรงงานฝึกโมเดล” และ “โรงงานรัน inference” เป็นโครงสร้างหลัก
เขากล่าวว่าบริษัทกำลังสร้างสิ่งที่เรียกว่า “AI factory ของจีน” โดยพยายามควบคุมทุกชั้นของเทคโนโลยี AI ด้วยตัวเอง
สแต็ก AI ที่ Alibaba ต้องการสร้างประกอบด้วย 5 ชั้นหลัก
แนวทางนี้ทำให้ Alibaba พยายามกลายเป็นบริษัท AI แบบ vertical integration คล้ายกับบริษัทเทคโนโลยีตะวันตกบางรายที่รวมฮาร์ดแวร์ คลาวด์ และโมเดล AI ไว้ในระบบเดียวกัน
การเปิดตัว Qwen3.7‑Max ไม่ได้เป็นเพียงการอัปเกรดโมเดลเท่านั้น แต่สะท้อนการเปลี่ยนแปลงของอุตสาหกรรม AI ไปสู่ ระบบ agent ที่สามารถวางแผน ทำงานหลายขั้นตอน และดำเนินภารกิจจริงได้ด้วยตัวเอง
สำหรับ Alibaba โมเดลนี้เป็น ศูนย์กลางด้านซอฟต์แวร์ ของแพลตฟอร์ม AI ที่ใหญ่กว่านั้น ซึ่งรวมถึง
Comments
0 comments