Thiết kế này tập trung vào throughput và băng thông dữ liệu, những yếu tố quan trọng khi CPU phải liên tục cung cấp dữ liệu cho các cụm GPU AI khổng lồ.
Theo các tài liệu kỹ thuật và thông báo của NVIDIA, Vera mang lại nhiều lợi thế so với nền tảng x86 truyền thống:
Các cải thiện này nhắm trực tiếp vào những tác vụ thường gặp trong hệ thống AI hiện đại: trình biên dịch, runtime, framework agent, công cụ scripting và các pipeline suy luận quy mô lớn.
NVIDIA cũng tuyên bố rằng kiến trúc này có thể đạt hiệu quả năng lượng gấp đôi so với hạ tầng CPU truyền thống trong một số workflow AI.
Điểm quan trọng là Vera không được thiết kế để hoạt động một mình. Nó là một phần của kiến trúc trung tâm dữ liệu AI thế hệ mới của NVIDIA.
Trong nền tảng Vera Rubin NVL72, một rack máy chủ có thể gồm:
Các bộ xử lý này giao tiếp thông qua NVLink‑C2C, cung cấp băng thông kết nối cực cao giữa CPU và GPU.
Điều này khác với kiến trúc trung tâm dữ liệu truyền thống, nơi GPU thường được gắn vào máy chủ x86 thông qua PCIe. NVIDIA muốn loại bỏ các điểm nghẽn truyền dữ liệu bằng cách đồng thiết kế CPU, GPU, mạng và phần mềm như một nền tảng duy nhất.
Theo các thông báo của NVIDIA, nhiều công ty lớn đang hợp tác triển khai hệ thống dựa trên Vera.
Các nhà cung cấp cloud và nền tảng AI bao gồm:
Các nhà sản xuất máy chủ xây dựng hệ thống quanh Vera gồm:
Điều này cho thấy Vera chủ yếu nhắm tới hạ tầng hyperscale và AI cloud, thay vì thị trường máy chủ doanh nghiệp truyền thống.
NVIDIA cho rằng CPU mới này mở ra một thị trường hoàn toàn mới cho công ty.
Theo các phát biểu từ lãnh đạo và phân tích thị trường:
Các con số này là dự báo và mô hình phân tích, nên chưa phải kết quả chắc chắn.
Intel Xeon và AMD EPYC vẫn đang thống trị thị trường CPU máy chủ. Tuy nhiên, vai trò của CPU trong trung tâm dữ liệu AI đang thay đổi.
Ngày càng nhiều workload AI khiến CPU chủ yếu:
Trong bối cảnh đó, băng thông bộ nhớ và khả năng kết nối GPU có thể quan trọng hơn hiệu năng CPU truyền thống. Vera được thiết kế chính xác cho vai trò này.
Nếu kiến trúc này được triển khai rộng rãi, ngành trung tâm dữ liệu có thể dần chuyển từ máy chủ x86 đa năng sang các nền tảng Arm tích hợp chặt với bộ tăng tốc AI.
Khi đó NVIDIA không chỉ bán GPU nữa — mà kiểm soát gần như toàn bộ stack hạ tầng AI: CPU, GPU, mạng kết nối và phần mềm. Và đó mới là tham vọng lớn nhất phía sau Vera.
Comments
0 comments