NVIDIA định vị Vera là "CPU cho kỷ nguyên của các AI tác tử". Không giống như các bộ xử lý máy chủ đa năng, Vera được tối ưu hóa cho các hệ thống AI tự động đòi hỏi khả năng ra quyết định liên tục và nhanh chóng – như học tăng cường, giao dịch cơ sở dữ liệu và xử lý dữ liệu thời gian thực .
Con chip này đánh dấu lõi CPU trung tâm dữ liệu hoàn toàn tùy chỉnh đầu tiên của NVIDIA, được gọi là "Olympus". Nó sử dụng giao diện nạp và giải mã lệnh rộng gấp 10 lần với một bộ dự đoán rẽ nhánh nơ-ron, về cơ bản là sử dụng AI để tăng tốc cho chính các tác vụ AI . Được xây dựng trên bộ lệnh Arm v9.2, chip cung cấp 176 luồng xử lý thông qua phân vùng tài nguyên vật lý thay vì đa luồng đồng thời thông thường
.
| Thông số | Chi tiết |
|---|---|
| Số nhân (Cores) | 88 nhân Olympus tùy chỉnh (tương thích Armv9.2) |
| Băng thông bộ nhớ | Lên đến 1.2 TB/s qua LPDDR5X |
| Kết nối NVLink-C2C | Băng thông 1.8 TB/s tới GPU Rubin |
| Tình trạng sản xuất | Sản xuất hàng loạt từ tháng 5/2026 |
Những thông điệp nội bộ của NVIDIA rất táo bạo. Công ty tuyên bố Vera giúp hoàn thành tác vụ nhanh hơn 1,8 lần so với CPU x86, hiệu suất đơn luồng nhanh hơn 50% và hiệu quả gấp đôi so với các bộ xử lý quy mô rack truyền thống .
Các bài kiểm tra độc lập vẽ nên một bức tranh có nhiều sắc thái hơn nhưng vẫn rất ấn tượng. Vào ngày 26 tháng 5 năm 2026, trang đánh giá hiệu năng Phoronix đã công bố những con số đầu tiên từ bên thứ ba. Trong phép đo trung bình nhân trên nhiều tác vụ khác nhau – bao gồm biên dịch mã, Python, Java và xử lý cơ sở dữ liệu – Vera 88 nhân đạt điểm số nhanh hơn 1,55 lần so với Intel Xeon 6980P hàng đầu và nhanh hơn khoảng 10% so với AMD EPYC 9575F. Nó cũng đánh bại CPU Grace đời trước của chính NVIDIA đến 1,6 lần và duy trì được 90% băng thông bộ nhớ cao nhất trong các bài kiểm tra STREAM TRIAD .
Phoronix đã ghi nhận thời gian biên dịch nhân Linux trong 20 giây trên Vera – nhanh gần gấp đôi trên mỗi nhân so với một chip x86 128 nhân .
Đây là máy chủ đầu tiên được thiết kế chuyên dụng cho CPU Vera. HPE đã trình làng nó tại COMPUTEX 2026, định vị sản phẩm này cho các tác vụ AI tác tử, học tăng cường và xử lý dữ liệu ở quy mô nhà máy AI . Máy chủ sẽ có mặt vào mùa thu năm 2026 như một phần trong danh mục Điện toán AI của NVIDIA
.
Đối với các môi trường triển khai có mật độ cao nhất, HPE cũng cung cấp máy chủ phiến (blade) siêu máy tính Cray GX240 làm mát bằng chất lỏng, có thể chứa tới 16 CPU Vera trên mỗi phiến và mở rộng lên đến 640 CPU và 56.320 nhân trên mỗi tủ rack .
Redpanda là lớp dữ liệu phát trực tuyến trong sự hợp tác này. Nền tảng này tương thích với các tác vụ của Apache Kafka (một nền tảng phát trực tuyến sự kiện phổ biến), và người sáng lập kiêm CEO Alex Gallego cho biết thử nghiệm nội bộ của công ty cho thấy Vera mang lại "độ trễ thấp hơn đến 5,5 lần" so với các hệ thống khác mà họ đã đánh giá . Đối với một sàn giao dịch chứng khoán xử lý hơn một nghìn tỷ tin nhắn mỗi ngày, việc giảm độ trễ đó không chỉ là học thuật – nó tác động trực tiếp đến chất lượng khớp lệnh và khả năng phục hồi của hệ thống
.
NYSE là khách hàng tài chính có danh tiếng nhất đang nghiên cứu Vera, nhưng danh sách những đơn vị tiên phong khác giống như một bản danh sách 'gọi tên' những ông lớn của ngành AI và điện toán đám mây.
Oracle là nhà cung cấp đám mây đầu tiên dự kiến sẽ triển khai Vera ở quy mô cực lớn, với kế hoạch tung ra hàng trăm nghìn CPU bắt đầu từ năm 2026 .
Câu chuyện về Vera không hề đứng một mình. Nó là nửa phần CPU của nền tảng Vera Rubin lớn hơn của NVIDIA – kết hợp với GPU Rubin thế hệ tiếp theo – được thiết kế để vận hành các nhà máy AI và siêu máy tính . Hệ thống quy mô rack Vera Rubin NVL144 được đánh giá ở mức 3,6 exaflop cho suy luận FP4 và 1,2 exaflop cho huấn luyện FP8, gấp khoảng 3,3 lần hiệu suất của GB300 NVL72 hiện tại
.
Đối với các thị trường tài chính, hàm ý rất rõ ràng: các sàn giao dịch và công ty thương mại đã bị 'khóa chặt' vào kiến trúc x86 trong nhiều thập kỷ. Vera đại diện cho một con đường đáng tin cậy để hướng tới hạ tầng dựa trên Arm, được tối ưu hóa cho AI, kết hợp băng thông bộ nhớ cực lớn, mật độ lõi khổng lồ và khả năng tích hợp tự nhiên với các nền tảng phát trực tuyến thời gian thực. Cuộc thử nghiệm của NYSE – dù vẫn còn ở giai đoạn đầu – báo hiệu rằng hạ tầng thị trường vốn đang hội tụ với máy tính hiệu suất cao và AI, không chỉ ở cấp độ phần mềm mà còn ở cấp độ nền tảng phần cứng silicon.
Comments
0 comments