แนวคิดแบบโมดูลาร์นี้ทำให้แร็คแต่ละชนิดสามารถถูกปรับแต่งให้เหมาะสมกับฟังก์ชันเฉพาะ ไม่ว่าจะเป็นการเทรน การอนุมาน ระบบเครือข่าย หรือการจัดเก็บข้อมูล ในขณะที่ทำงานร่วมกันเป็นซูเปอร์คอมพิวเตอร์โลจิคัลเครื่องเดียว
การเร่งการผลิตนี้เกิดขึ้นในระดับโลก NVIDIA ยืนยันว่าพาร์ทเนอร์ในระบบนิเวศซัพพลายเชนหลายร้อยรายกำลังผลิตระบบ Vera Rubin โดยมีพาร์ทเนอร์มากกว่า 150 รายอยู่ในไต้หวันเพียงประเทศเดียว การผลิตครอบคลุมโรงงานมากกว่า 350 แห่งใน 30 ประเทศ ซึ่งเป็นสัญญาณชัดเจนว่า NVIDIA กำลังเตรียมพร้อมสำหรับปริมาณการผลิตมหาศาลเพื่อตอบสนองความต้องการจากห้องปฏิบัติการ AI, ผู้ให้บริการคลาวด์, และบริษัทไฮเปอร์สเกล
ผู้ประกอบระบบชั้นนำที่อยู่ในขั้นตอนการผลิตเต็มรูปแบบแล้ว ได้แก่ Dell Technologies, HPE, Lenovo, และ Supermicro
สะท้อนให้เห็นว่า "Made in Taiwan" ยังคงเป็นหัวใจสำคัญของห่วงโซ่อุปทานเทคโนโลยีระดับโลก
ภายในหนึ่งวันหลังจากการปาฐกถาในงาน GTC ไทเป CoreWeave ได้ประกาศว่าบริษัทเสร็จสิ้นการนำร่องและตรวจสอบระบบ Vera Rubin NVL72 เป็นรายแรกของอุตสาหกรรมบน CoreWeave Cloud การประกาศดังกล่าวยืนยันว่าแร็คนี้ให้ประสิทธิภาพการอนุมานต่อวัตต์ที่ดีขึ้นสูงสุดถึง 10 เท่า เมื่อเทียบกับรุ่นก่อนหน้า พร้อมกับการลดจำนวน GPU ที่จำเป็นสำหรับการประมวลผลภาระงานขนาดใหญ่
ความรวดเร็วของ CoreWeave ในการสร้างระบบที่พร้อมปฏิบัติการได้อย่างสมบูรณ์ ตอกย้ำถึงความเป็นหุ้นส่วนทางวิศวกรรมที่ลึกซึ้งกับ NVIDIA และทำให้ CoreWeave กลายเป็นผู้ให้บริการการเข้าถึงก่อนใคร (Early Access) ชั้นนำสำหรับยุคของ Rubin
Vera CPU เป็นจุดเปลี่ยนสำคัญสำหรับแพลตฟอร์มนี้ โดยถูกขนานนามว่าเป็นหน่วยประมวลผลกลางสำหรับศูนย์ข้อมูลแบบสแตนด์อโลนตัวแรกของ NVIDIA ที่เข้าสู่การผลิตจำนวนมาก โดยคาดว่าจะเริ่มจัดส่งได้ในช่วงครึ่งหลังของปี 2026 NVIDIA ได้ออกแบบชิปนี้มาเพื่อความต้องการของ AI agents อัตโนมัติโดยเฉพาะ ซึ่งต้องการการประมวลผลที่มีทรูพุตสูงและหน่วงเวลาต่ำ ข้ามผ่านพูลหน่วยความจำขนาดมหึมา ลูกค้ารายแรกๆ ที่ได้รับการยืนยันสำหรับ Vera CPU ได้แก่ OpenAI, Anthropic, และ SpaceX
การเปลี่ยนผ่านสู่การผลิตเต็มรูปแบบของ Vera Rubin เป็นสัญญาณบ่งบอกถึงการเปลี่ยนแปลงครั้งใหญ่ในอุตสาหกรรม ไปสู่โครงสร้างพื้นฐานที่สร้างขึ้นเพื่อวัตถุประสงค์เฉพาะสำหรับ AI แบบ Agentic ซึ่งเป็นระบบที่ไม่เพียงแต่สร้างการตอบสนอง แต่ยังสามารถให้เหตุผล วางแผน และดำเนินการกระทำหลายขั้นตอนได้ ด้วยการรวมเทคโนโลยีการอนุมานแบบหน่วงเวลาต่ำของ Groq เข้ากับสถาปัตยกรรม POD โดยตรง NVIDIA กำลังพุ่งเป้าไปยังภาระงานรูปแบบใหม่ที่ความเร็วและประสิทธิภาพในการอนุมานเป็นสิ่งสำคัญยิ่ง
แพลตฟอร์มนี้คาดว่าจะพร้อมให้บริการโดยทั่วไปสำหรับผู้ให้บริการคลาวด์และองค์กรต่างๆ ในช่วงครึ่งหลังของปี 2026 โดย AWS, Google Cloud, Microsoft Azure, และ Oracle Cloud Infrastructure ล้วนถูกระบุชื่อว่าเป็นผู้ที่จะเริ่มปรับใช้ในช่วงแรก จากการที่ Vera Rubin ได้รับการประกาศว่ากำลังเข้าสู่การผลิตแล้วที่งาน CES ในเดือนมกราคม และอีกครั้งที่งาน GTC ในเดือนมีนาคม การอัปเดตที่งาน GTC ไทเปจึงเป็นการยืนยันว่าการเร่งการผลิตนี้ยังคงมีแรงส่งอย่างต่อเนื่อง และขณะนี้ได้รับการสนับสนุนจากซัพพลายเชนระดับโลกที่ปรับขนาดได้อย่างเต็มที่แล้ว
Comments
0 comments