ด้วยคะแนน 1,541 แต้มภายใต้มาตรวัดที่โหดหินนี้ Qwen3.7-Max พิสูจน์ให้เห็นว่าตระกูลโมเดล Qwen ของ Alibaba พร้อมแข่งขันในระดับแนวหน้าของโลกได้อย่างเต็มตัวแล้ว มันไม่เพียงแค่แซงทางเลือกกระแสหลักจากสหรัฐฯ ได้อย่างชัดเจน แต่ยังทำคะแนนด้านการเขียนโค้ดได้เหนือกว่า Claude Opus 4.6 เวอร์ชันไม่ใช้การคิดวิเคราะห์ (non-thinking) อีกด้วย
ผลลัพธ์นี้ทำลายภาพจำเดิมๆ ที่ว่าตำแหน่งหัวตาราง AI ด้านการเขียนโค้ดนั้นถูกแบ่งกันอยู่แค่ระหว่างสองบริษัทจากสหรัฐอเมริกา มันส่งสัญญาณว่าขณะนี้ห้องแล็บ AI จากจีนได้พิสูจน์แล้วว่าสามารถสร้างโมเดลที่แข่งขันได้ในระดับแนวหน้าของงานพัฒนาซอฟต์แวร์ในโลกแห่งความเป็นจริง การก้าวขึ้นมาอย่างรวดเร็วของ Qwen3.7-Max นั้นสอดคล้องกับกระแสที่กำลังเกิดขึ้นบนสังเวียน AI โค้ดดิ้ง ที่มีห้องแล็บจีนอีกหลายแห่งรวมถึง 'Kimi K2.5' จาก Moonshot ที่พึ่งไต่อันดับขึ้นมาติดท็อป 10 ได้ในระยะหลังๆ นี้
แม้ว่าผลงานบน Code Arena จะดึงดูดความสนใจได้มากที่สุด แต่ Qwen3.7-Max ยังแสดงประสิทธิภาพที่โดดเด่นในด้านอื่นๆ ด้วย โดยมันสามารถคว้าอันดับ 10 บนตาราง Design Arena มาได้ ซึ่งแสดงให้เห็นถึงความแข็งแกร่งในการประเมินผลแบบหลากรูปแบบ (multi-modal) ที่เหนือกว่าการสร้างโค้ดเพียงอย่างเดียว นอกจากนี้ ตัวโมเดลยังได้รับการอธิบายว่าผสมผสานความสามารถในการให้เหตุผลเข้ากับการรองรับการทำงานอัตโนมัติต่อเนื่องระยะยาว รวมถึงการทำงานต่อเนื่องนานสูงสุด 35 ชั่วโมงและเรียกใช้เครื่องมือต่างๆ (Tool Calls) ได้มากกว่า 1,000 ครั้ง
สำหรับนักพัฒนาและองค์กรธุรกิจ ความหมายนั้นชัดเจน: ผู้ช่วยเขียนโค้ด AI ในยุคต่อไปไม่ได้ถูกจำกัดอยู่แค่บริษัทใดบริษัทหนึ่งหรือที่ใดที่หนึ่งอีกต่อไป Qwen3.7-Max จาก Alibaba ได้วางตำแหน่งตัวเองให้อยู่ในลิสต์โมเดลระดับแนวหน้าที่ควรค่าแก่การนำไปเทียบเคียงประสิทธิภาพสำหรับกระบวนการทำงานด้านวิศวกรรมซอฟต์แวร์ในโลกแห่งความจริงแล้ว
Comments
0 comments