ความหมายของตัวเลขเหล่านี้คือ
SWE‑Bench Multilingual
Terminal‑Bench 2.0
ถ้าเทียบกับรุ่นก่อนหน้า การพัฒนาถือว่าก้าวกระโดด เช่น
โดยรวมแล้ว Composer 2.5 ถูกจัดอยู่ใน กลุ่มโมเดลระดับแนวหน้า (frontier tier) สำหรับงานเขียนโค้ด แม้จะไม่ได้ชนะทุก benchmark ก็ตาม
สิ่งที่สร้างแรงสั่นสะเทือนจริง ๆ คือ โครงสร้างราคา ของโมเดลนี้
ราคาของ Composer 2.5 อยู่ที่ประมาณ
และมีเวอร์ชันเร็ว (fast) ที่ราคา
ขณะที่รายงานบางแหล่งประเมินว่า
สิ่งนี้สำคัญมาก เพราะ workflow แบบ agentic coding ใช้โทเคนจำนวนมหาศาล เช่น
ทุกขั้นตอนอาจต้องเรียกโมเดลหลายครั้ง ทำให้ ต้นทุนต่อ task พุ่งสูงได้ง่าย
ราคาที่ต่ำกว่าจึงทำให้ Cursor สามารถให้ agent ทำ reasoning หลายขั้นตอนมากขึ้นโดยไม่ทำให้ค่าใช้จ่ายเพิ่มแบบก้าวกระโดด
Composer 2.5 สร้างต่อยอดจาก checkpoint แบบ open‑weight ชื่อ Kimi K2.5 ของ Moonshot AI ก่อนที่ทีม Cursor จะทำการฝึกเพิ่มเฉพาะด้าน software engineering
รายงานเกี่ยวกับกระบวนการฝึกระบุว่า
การใช้ synthetic tasks ทำให้โมเดลฝึก workflow ซ้ำ ๆ เช่น
วิธีนี้ช่วยเพิ่มความเสถียรเมื่อเจอ ปัญหาการพัฒนาซอฟต์แวร์จริงที่มีหลายขั้นตอน
ในช่วงแรก Cursor พึ่งพาโมเดลจากบริษัทอื่น เช่น
แต่การพัฒนาโมเดลของตัวเองอย่าง Composer ทำให้บริษัทสามารถ
ประเด็นนี้สำคัญเพราะคู่แข่งอย่าง Claude Code ของ Anthropic ได้เปรียบจากการที่บริษัทเดียวกันควบคุมทั้งโมเดลและเครื่องมือเขียนโค้ด
การมีโมเดลของตัวเองจึงช่วยให้ Cursor แข่งขันในตลาด “model + developer tool” แบบครบแพลตฟอร์ม ได้จริง
Composer 2.5 อาจไม่ได้ครองอันดับหนึ่งในทุก benchmark แต่ก็แสดงให้เห็นว่า
หาก Cursor สามารถพัฒนาโมเดลในบ้านให้ดีขึ้นต่อเนื่อง พร้อมรักษาต้นทุนที่ต่ำกว่าได้ โมเดลตระกูล Composer อาจมีบทบาทสำคัญในการเปลี่ยนเศรษฐศาสตร์ของ AI‑assisted software development โดยเฉพาะสำหรับ coding agents ที่ทำงานภายใน IDE แบบต่อเนื่อง
Comments
0 comments