การเปลี่ยนจาก Dual-Socket มาเป็นชิปเดี่ยวแบบ Monolithic Die ตัดปัญหาการสื่อสารข้ามซ็อกเก็ตได้ทั้งหมด สำหรับโหลดงานที่กระจายตัวข้ามหลายคอร์ เช่น Pipeline สำหรับการอนุมานแบบเรียลไทม์ ฐานข้อมูลแบบ In-Memory หรือ Microservices ขนาดใหญ่ การลด Latency เพียงอย่างเดียวก็ช่วยเพิ่มปริมาณงาน (Throughput) ได้อย่างชัดเจน
AWS รายงานประสิทธิภาพที่ดีขึ้นอย่างต่อเนื่อง ซึ่งสอดคล้องกับผลวิเคราะห์ของบุคคลที่สามและ Benchmark จากลูกค้าจริง:
ด้านการประมวลผล:
ด้าน I/O และแบนด์วิดท์:
ผลลัพธ์จากลูกค้าจริง:
ตัวเลขเหล่านี้สอดคล้องกับการเปลี่ยนแปลงทางสถาปัตยกรรม L3 Cache ที่ใหญ่ขึ้น 5 เท่าช่วยลดการเข้าถึง DRAM ซึ่งมีค่าใช้จ่ายสูง โดยเฉพาะสำหรับงานที่ต้องทำงานกับข้อมูลปริมาณมากๆ (Working Set ขนาดใหญ่) แรม DDR5-8800 และ PCIe Gen 6 ปลดล็อกคอขวด I/O ที่จำกัดประสิทธิภาพของรุ่นก่อนหน้า และการออกแบบ Single-Socket ช่วยลดภาระ Latency ที่แอปพลิเคชันต้องจ่ายเมื่อทำงานบนสถาปัตยกรรม NUMA
สำหรับโหลดงานที่ต้องการพื้นที่เก็บข้อมูลชั่วคราวความเร็วสูง AWS มีตัวเลือกเสริมเป็น รุ่น M9gd โดยเพิ่มพื้นที่จัดเก็บข้อมูลแบบ NVMe SSD เข้ากับแพลตฟอร์มประมวลผล Graviton5 ให้ความจุสูงสุด 11.4 TB และมี IOPS สูงกว่ารุ่นก่อนหน้าถึง 30%
รุ่นนี้เหมาะสำหรับงานอย่าง Caching Fleet ขนาดใหญ่, Log Processing Pipeline หรือ Real-Time Analytics ที่ยิ่งเก็บข้อมูลใกล้กับ CPU ได้มากเท่าไหร่ Latency และ Throughput ก็ดีขึ้นเท่านั้น
อีกหนึ่งกลยุทธ์ที่น่าสนใจคือ AWS วางตำแหน่งให้ Graviton5 เหมาะสำหรับ Agentic AI —หรือระบบ AI ที่สามารถดำเนินการแทน หรือ คิดหลายขั้นตอน (Multi-Step Orchestration) เช่น การเขียนโค้ด การให้เหตุผลแบบเรียลไทม์ โดยใช้ Large Language Models (LLM) และ Generative AI
แม้ว่า GPU ยังจำเป็นสำหรับการเทรนโมเดลและ Large-Batch Inference แต่งาน Agentic AI ขนาดใหญ่จะสร้างรูปแบบการประมวลผลที่แตกต่างออกไป นั่นคือการใช้ CPU ทำงานต่อเนื่อง หมุนเวียนระหว่างการอนุมานและการตัดสินใจภายใต้กรอบเวลา Latency ที่เข้มงวดมาก AWS เชื่อว่า Latency ระหว่างคอร์ที่ต่ำลง 33%, Cache ที่ใหญ่ขึ้น 5 เท่า และจำนวนคอร์มหาศาล ทำให้ Graviton5 ตอบโจทย์นี้ได้ดี โดยไม่ต้องพึ่งพา GPU ที่มีราคาสูงกว่า
เหนือกว่าเรื่องประสิทธิภาพ คือการเปลี่ยนแปลงระดับรากฐานด้านความปลอดภัยของคลาวด์ Nitro Isolation Engine เป็นองค์ประกอบใหม่ที่เพิ่มเข้ามาในระบบ AWS Nitro เจเนอเรชันที่ 6
สิ่งที่ทำให้ระบบนี้ต่างจากไฮเปอร์ไวเซอร์อื่นๆ คือการออกแบบให้มีขนาดเล็กและสร้างมาเพื่อจุดประสงค์เดียวคือ บังคับใช้การแยกส่วน (Isolation) เครื่องเสมือน โดยพัฒนาด้วยภาษา Rust และที่สำคัญคือ Formal Verification: AWS ได้สร้าง ข้อพิสูจน์ที่ตรวจสอบได้ด้วยเครื่องมือ (Machine-Checkable Proofs) ด้วยเครื่องมือ Isabelle Proof Assistant เพื่อยืนยันในทางคณิตศาสตร์ว่า :
ในทางปฏิบัติ นี่หมายความว่า AWS สามารถให้ความมั่นใจได้ในทางคณิตศาสตร์ว่า โหลดงานของลูกค้ารายหนึ่งจะไม่สามารถเข้าถึงข้อมูลหรือรบกวนการทำงานของลูกค้าอีกราย รวมถึงผู้ให้บริการอย่าง AWS เองก็อยู่ภายใต้ข้อจำกัดเดียวกัน ระบบนี้จะเปิดใช้งานเป็นค่าเริ่มต้นบน M9g
นี่คือการเปลี่ยนวิธีคิดเรื่องความปลอดภัยบนคลาวด์ จากการควบคุมเชิงปฏิบัติการและการตรวจสอบ มาสู่การรับประกันเชิงคณิตศาสตร์
ชื่อบริษัทเทคโนโลยีระดับโลกที่ประกาศตัวเป็นลูกค้าช่วงเริ่มต้น ได้แก่ Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian และ ClickHouse โดยผลลัพธ์ที่น่าสนใจคือ:
การมาถึงของ Graviton5 ตอกย้ำจุดเปลี่ยนที่ชิปเซิร์ฟเวอร์ Arm ไม่ใช่แค่ทางเลือกเพื่อลดต้นทุนอีกต่อไป แต่เป็นตัวเลือกด้านประสิทธิภาพระดับเมนสตรีม เพราะตลอด 3 ปีที่ผ่านมา กว่าครึ่งหนึ่งของกำลังประมวลผล CPU ใหม่บน AWS ทำงานบน Graviton และ 98% ของลูกค้า EC2 ระดับท็อป 1,000 รายใช้ Graviton อยู่แล้ว
ด้วย 192 คอร์บนเทคโนโลยี 3nm, PCIe Gen 6, แรม DDR5-8800 และการแยกส่วนโหลดงานที่พิสูจน์ได้ทางคณิตศาสตร์ Graviton5 ไม่ได้แค่เพิ่มขีดความสามารถให้ AWS เอง แต่ยังยกระดับความคาดหวังที่ลูกค้าพึงมีต่อการประมวลผลแบบคลาวด์ ทั้งเรื่องประสิทธิภาพ การใช้พลังงาน และความปลอดภัยบนรากฐานของข้อพิสูจน์ทางคณิตศาสตร์
M9g และ M9gd พร้อมให้บริการแล้วผ่านเส้นทางมาตรฐานของ EC2 และคาดว่า C9g (เน้น Compute) และ R9g (เน้น Memory) จะตามมาในไม่ช้า
Comments
0 comments