Phần lớn trung tâm dữ liệu hiện nay sử dụng CPU Intel Xeon hoặc AMD EPYC. Đây là các bộ xử lý đa dụng, được thiết kế để chạy nhiều loại ứng dụng doanh nghiệp khác nhau.
Vera đi theo hướng khác.
Thay vì hoạt động độc lập, Vera được xây dựng như lớp điều khiển cho các cụm GPU tăng tốc.
Kiến trúc của nó được tối ưu để:
Vera sử dụng kiến trúc Arm 88 lõi, tập trung vào hiệu quả năng lượng và băng thông cao cho từng lõi.
Chip máy chủ Arm ngày càng phổ biến trong các hệ thống quy mô lớn vì thường có hiệu năng trên mỗi watt tốt hơn trong các workload song song lớn.
Theo Nvidia, Vera có thể mang lại:
Các cải thiện này chủ yếu đến từ việc thiết kế CPU để hoạt động trong hệ sinh thái tăng tốc của Nvidia thay vì phục vụ mục đích chung.
Vera không phải sản phẩm độc lập. Nó là một phần của nền tảng Vera Rubin, thế hệ hệ thống AI tiếp theo của Nvidia.
Nền tảng này kết hợp:
Hệ thống được thiết kế để xử lý các workload AI đòi hỏi cao như:
Mục tiêu là giảm các nút thắt giao tiếp và tăng tokens-per-watt khi suy luận, giúp giảm chi phí chạy AI quy mô lớn.
Trong hơn một thập kỷ, Nvidia thống trị thị trường GPU cho AI. Nhưng hiện nay công ty đang mở rộng sang toàn bộ stack hạ tầng AI.
Hệ sinh thái của hãng ngày càng bao gồm:
Nếu chiến lược này thành công, nó có thể thay đổi cấu trúc trung tâm dữ liệu vốn lâu nay dựa vào CPU Intel hoặc AMD kết hợp với accelerator bên thứ ba.
Các công ty đám mây quy mô lớn – thường gọi là hyperscalers như Microsoft, Meta, Alibaba hay Oracle – đóng vai trò quan trọng trong chiến lược của Nvidia.
Ví dụ, các siêu nhà máy AI Fairwater của Microsoft dự kiến sử dụng hệ thống rack-scale dựa trên nền tảng Vera Rubin, có thể triển khai hàng trăm nghìn chip trong các cụm máy khổng lồ.
Những môi trường này thường được gọi là “AI factory” – các trung tâm dữ liệu được tối ưu hóa hoàn toàn cho việc huấn luyện và chạy mô hình AI ở quy mô cực lớn.
Chiến lược mở rộng sang CPU diễn ra trong giai đoạn tăng trưởng tài chính mạnh mẽ của Nvidia.
Công ty báo cáo:
Nvidia cũng dự báo khoảng 91 tỷ USD doanh thu cho quý tiếp theo, phản ánh nhu cầu mạnh mẽ đối với hạ tầng AI.
Trong dài hạn, CEO Jensen Huang thậm chí dự đoán đơn đặt hàng tích lũy lên tới 1 nghìn tỷ USD cho các hệ thống Blackwell và Vera Rubin trong những năm tới.
Ý nghĩa lớn nhất của Vera không chỉ là một CPU nhanh hơn.
Đó là nỗ lực của Nvidia nhằm mở rộng từ accelerator sang toàn bộ ngăn xếp tính toán trong trung tâm dữ liệu AI.
Trong nhiều thập kỷ, socket CPU trong máy chủ gần như thuộc về Intel và AMD. Bằng cách đưa ra CPU tích hợp chặt chẽ với GPU của mình, Nvidia đang cố gắng chiếm luôn phần chi phí phần cứng đó.
Nếu các hyperscaler chấp nhận rộng rãi kiến trúc này, trung tâm dữ liệu AI tương lai có thể chuyển từ mô hình linh kiện đa nhà cung cấp sang hệ thống AI tích hợp dọc xoay quanh GPU.
Dù vậy, cần lưu ý rằng 200 tỷ USD chỉ là ước tính thị trường của Nvidia. Việc nó có trở thành hiện thực hay không còn phụ thuộc vào nhiều yếu tố như mức độ chấp nhận CPU Arm trong máy chủ, năng lực sản xuất và việc các nhà cung cấp đám mây có sẵn sàng rời bỏ hạ tầng x86 hiện tại hay không.
Một điều rõ ràng: trong kỷ nguyên agentic AI, CPU – từng là thành phần ít được chú ý phía sau GPU – đang trở lại vị trí chiến lược.
Comments
0 comments