Microsoft เปิดตัว Maia 200 ในฐานะ AI accelerator รุ่นที่สองที่ออกแบบมาเพื่อ “inference” โดยเฉพาะ
Inference คือขั้นตอนที่โมเดล AI ที่ฝึกแล้วถูกนำไปใช้ตอบคำถามผู้ใช้ ซึ่งเป็นต้นทุนที่เกิดขึ้นทุกครั้งที่มีการใช้งาน AI
สเปกสำคัญของ Maia 200 ได้แก่
Microsoft ระบุว่าการออกแบบนี้ช่วยให้ระบบมี ประสิทธิภาพต่อราคาดีขึ้นประมาณ 30% เมื่อเทียบกับฮาร์ดแวร์รุ่นก่อนในโครงสร้างพื้นฐาน Azure
เหตุผลที่ชิปแบบนี้สำคัญคือ งาน inference ต้องการความเร็วในการประมวลผลจำนวนมากพร้อมต้นทุนต่อคำตอบที่ต่ำ ซึ่งเป็นจุดที่ชิปเฉพาะทางมักทำได้ดีกว่า GPU แบบทั่วไป
ดีลที่กำลังพูดถึงนี้ไม่ได้เกิดขึ้นอย่างโดดเดี่ยว เพราะทั้งสองบริษัทมีความสัมพันธ์ทางธุรกิจขนาดใหญ่อยู่แล้ว
ในปี 2025 Microsoft, Nvidia และ Anthropic ประกาศความร่วมมือเชิงกลยุทธ์ โดย
หากมีการใช้เซิร์ฟเวอร์ที่ใช้ Maia 200 จริง ก็มีแนวโน้มว่าจะเป็น ส่วนเสริมของโครงสร้างพื้นฐานเดิม มากกว่าการแทนที่ GPU ของ Nvidia เพราะ GPU ยังคงเป็นตัวหลักสำหรับการฝึกโมเดลขนาดใหญ่
ในทางปฏิบัติ Maia อาจถูกใช้กับงานบางประเภท เช่น inference ขนาดใหญ่ ที่ชิปเฉพาะทางให้ต้นทุนต่อการประมวลผลที่ดีกว่า
การเจรจาครั้งนี้ยังสะท้อนแนวโน้มสำคัญของอุตสาหกรรม AI
ผู้พัฒนาโมเดลชั้นนำเริ่มกระจายงานไปยัง หลายคลาวด์และหลายสถาปัตยกรรมชิป แทนที่จะพึ่งผู้ให้บริการรายเดียว
ข้อดีของกลยุทธ์นี้ ได้แก่
ผู้ให้บริการคลาวด์รายใหญ่จึงเริ่มพัฒนาชิปของตัวเองมากขึ้น เช่น
เป้าหมายคือควบคุมสแต็กเทคโนโลยีตั้งแต่ชิปไปจนถึงแพลตฟอร์มคลาวด์ และลดการพึ่งพาผู้ผลิตชิปภายนอกอย่าง Nvidia
หาก Anthropic ใช้ Maia 200 ในระดับขนาดใหญ่จริง มันจะส่งสัญญาณชัดเจนว่า ชิปที่ออกแบบโดยผู้ให้บริการคลาวด์เองกำลังกลายเป็นทางเลือกที่น่าเชื่อถือสำหรับงาน AI ระดับโลก
แม้ Nvidia จะยังเป็นผู้ครองตลาด AI compute อยู่ แต่ผู้ให้บริการคลาวด์ขนาดใหญ่กำลังเร่งสร้างระบบแบบ “vertical integration” ตั้งแต่ศูนย์ข้อมูล ชิป ไปจนถึงแพลตฟอร์ม AI
ดังนั้น การใช้งาน Maia บน Azure สำหรับ Claude ไม่ใช่แค่ดีลโครงสร้างพื้นฐานอีกสัญญาหนึ่ง แต่เป็นสัญญาณว่า
การแข่งขันในยุค AI ต่อจากนี้จะเกิดขึ้นในระดับซิลิคอนเอง — ไม่ใช่แค่ซอฟต์แวร์หรือบริการคลาวด์เท่านั้น
Comments
0 comments