CPU Vera của Nvidia là gì và vì sao nó quan trọng với các trung tâm dữ liệu AI
CPU Vera là bộ xử lý trung tâm dữ liệu dựa trên Arm do Nvidia tự thiết kế cho các hệ thống AI thế hệ mới; những đơn vị đầu tiên được giao cho Anthropic, OpenAI, SpaceXAI và Oracle Cloud Infrastructure. Con chip đóng vai trò “bộ não điều phối” trong hệ thống AI: quản lý workflow của agent, truy vấn dữ liệu, mô phỏng...
What is Nvidia’s new Vera CPU, which AI companies and cloud providers have received the first units, what technical features and performanceNvidia’s Vera CPU is designed to work alongside Rubin GPUs in rack‑scale AI systems built for large‑scale agentic AI workloads.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What is Nvidia’s new Vera CPU, which AI companies and cloud providers have received the first units, what technical features and performance. Article summary: Nvidia’s Vera CPU is a new in-house data-center processor built to sit beside Rubin GPUs in Nvidia’s next rack-scale AI systems, with Nvidia positioning it specifically for agentic AI, reinforcement learning, retrieval, . Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs | The Tech Buzz. The first NVIDIA Vera CPUs arrived at three of the world's leading AI labs on Friday — Anthr" source context "Vera Arrives: NVIDIA's First CPU Built for Agents Lands at Top AI Labs" Reference image 2: visual subject "### NVIDI
openai.com
CPU Vera của Nvidia là gì?
Nvidia Vera là CPU trung tâm dữ liệu đầu tiên do Nvidia tự thiết kế dành riêng cho các hệ thống AI hiện đại. Con chip được giới thiệu cùng kiến trúc GPU Rubin và trở thành nền tảng CPU cho thế hệ siêu máy tính AI mới mà Nvidia gọi là kỷ nguyên agentic AI — nơi các mô hình AI không chỉ trả lời câu hỏi mà còn tự thực hiện nhiều bước hành động, gọi công cụ và xử lý workflow phức tạp.
Vera nằm trong nền tảng Vera Rubin, một hệ thống tích hợp CPU, GPU, mạng và các bộ xử lý dữ liệu thành một kiến trúc “AI factory” hoàn chỉnh cho huấn luyện và suy luận AI ở quy mô lớn.
Những tổ chức đầu tiên nhận CPU Vera
Tháng 5/2026, Nvidia bắt đầu giao các hệ thống Vera đầu tiên cho một số phòng thí nghiệm AI và nhà cung cấp cloud lớn. Các đơn vị nhận lô đầu gồm:
Anthropic (San Francisco)
OpenAI (Mission Bay, San Francisco)
SpaceXAI (Palo Alto)
Oracle Cloud Infrastructure – OCI (Santa Clara)
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Câu trả lời ngắn gọn cho "CPU Vera của Nvidia là gì và vì sao nó quan trọng với các trung tâm dữ liệu AI" là gì?
CPU Vera là bộ xử lý trung tâm dữ liệu dựa trên Arm do Nvidia tự thiết kế cho các hệ thống AI thế hệ mới; những đơn vị đầu tiên được giao cho Anthropic, OpenAI, SpaceXAI và Oracle Cloud Infrastructure.
Những điểm chính cần xác nhận đầu tiên là gì?
CPU Vera là bộ xử lý trung tâm dữ liệu dựa trên Arm do Nvidia tự thiết kế cho các hệ thống AI thế hệ mới; những đơn vị đầu tiên được giao cho Anthropic, OpenAI, SpaceXAI và Oracle Cloud Infrastructure. Con chip đóng vai trò “bộ não điều phối” trong hệ thống AI: quản lý workflow của agent, truy vấn dữ liệu, mô phỏng và reinforcement learning, trong khi GPU Rubin xử lý các phép tính tensor nặng.
Tôi nên làm gì tiếp theo trong thực tế?
Vera là một phần của nền tảng Rubin NVL72 gồm 72 GPU và 36 CPU, thể hiện chiến lược của Nvidia bán trọn bộ hạ tầng AI thay vì chỉ GPU, cạnh tranh trực tiếp với CPU server của AMD và Intel.
Theo Nvidia, các hệ thống ban đầu được đích thân Phó Chủ tịch phụ trách hyperscale và HPC Ian Buck bàn giao cho các đối tác trong giai đoạn triển khai thử nghiệm hạ tầng AI thế hệ mới.
Vera được thiết kế cho loại workload nào?
Không giống CPU máy chủ truyền thống, Vera được tối ưu cho các hệ thống AI có nhiều thành phần phối hợp giữa CPU và GPU.
Trong các hệ thống AI hiện đại, CPU thường phải xử lý nhiều nhiệm vụ ngoài phép tính tensor, chẳng hạn:
điều phối agent và vòng lặp lập kế hoạch
truy vấn dữ liệu cho retrieval‑augmented generation
môi trường mô phỏng và reinforcement learning
sandbox cho agent và các bước suy luận nhiều giai đoạn
Những workload này yêu cầu hiệu năng đơn luồng cao, truy cập bộ nhớ nhanh và kết nối cực nhanh với GPU — các yếu tố mà Vera được tối ưu hóa.
Kiến trúc kỹ thuật chính của CPU Vera
Thông tin kỹ thuật công khai cho thấy Vera là CPU trung tâm dữ liệu dựa trên Arm với lõi do Nvidia tự thiết kế.
Một số đặc điểm chính:
88 lõi Armv9.2 “Olympus”
176 luồng xử lý nhờ công nghệ spatial multithreading
Băng thông bộ nhớ khoảng 1,2 TB/s
Kết nối NVLink‑C2C với GPU đạt ~1,8 TB/s
Nhờ kiến trúc này, CPU đóng vai trò bộ máy điều phối và bộ nhớ cho toàn hệ thống AI, trong khi GPU Rubin đảm nhiệm phần tính toán ma trận và tensor nặng cho huấn luyện và suy luận mô hình.
Thiết kế này tiếp nối chiến lược sử dụng chip Arm tùy biến của Nvidia, sau thế hệ Grace CPU trong nền tảng Grace Hopper.
Các tuyên bố hiệu năng cho agentic AI
Nvidia cho rằng Vera được tối ưu cho workload AI có nhiều thành phần phối hợp, thay vì chỉ tính toán GPU thuần túy.
Theo các benchmark do hãng công bố, Vera có thể đạt:
Hiệu quả năng lượng gấp 2 lần so với CPU rack truyền thống
Hiệu năng nhanh hơn khoảng 50% trong một số workload
Agent sandbox chạy nhanh hơn tới 50%
Truy vấn dữ liệu doanh nghiệp nhanh hơn tới 3 lần
Các con số này hiện chủ yếu dựa trên benchmark của Nvidia, vì vậy vẫn cần thêm kiểm chứng độc lập để đánh giá đầy đủ.
Vai trò của Vera trong hệ thống Rubin NVL72
Vera không được thiết kế để chạy độc lập mà là một phần của nền tảng Vera Rubin.
Hệ thống tiêu biểu nhất là rack Vera Rubin NVL72, bao gồm:
72 GPU Rubin
36 CPU Vera
NVLink 6 switching fabric
ConnectX‑9 SuperNIC
BlueField‑4 DPU
mạng Quantum‑X800 InfiniBand hoặc Spectrum‑X Ethernet
Toàn bộ rack hoạt động như một siêu máy tính AI cấp rack, tối ưu cho huấn luyện mô hình lớn, suy luận và các hệ thống agent phức tạp.
Ngoài ra, Nvidia cũng giới thiệu rack chỉ dùng CPU Vera chứa tối đa 256 CPU làm mát bằng chất lỏng, phục vụ các workload điều phối, mô phỏng và reinforcement learning trong các cụm AI lớn.
Vì sao Vera quan trọng với chiến lược của Nvidia
Trong nhiều năm, Nvidia thống trị hạ tầng AI chủ yếu nhờ GPU. Nhưng khi quy mô hệ thống AI tăng lên, trung tâm dữ liệu ngày càng cần một stack phần cứng hoàn chỉnh.
Với Vera, Nvidia đang mở rộng từ nhà sản xuất GPU sang nhà cung cấp toàn bộ hạ tầng AI.
Điều này cho phép hãng kiểm soát chặt chẽ hơn:
CPU điều phối workload
truy cập bộ nhớ GPU
kết nối mạng tốc độ cao
hệ sinh thái phần mềm CUDA
Thay vì phụ thuộc vào CPU từ Intel Xeon hoặc AMD EPYC, Nvidia có thể cung cấp cả CPU lẫn GPU trong cùng một hệ thống tích hợp.
Cạnh tranh với AMD và Intel
Việc ra mắt Vera cũng đưa Nvidia bước vào thị trường CPU máy chủ — vốn lâu nay do Intel và AMD thống trị.
Theo dữ liệu của Mercury Research được Tom’s Hardware trích dẫn, AMD đã đạt hơn 33% thị phần server CPU theo số lượng và khoảng 46% doanh thu x86 server CPU vào đầu năm 2026.
Sự xuất hiện của Vera cho thấy Nvidia muốn giành thêm phần giá trị phần cứng trong trung tâm dữ liệu AI, thay vì chỉ bán GPU.
Xu hướng lớn: hạ tầng AI đang “tích hợp theo chiều dọc”
Sự ra mắt của Vera phản ánh một xu hướng lớn trong ngành điện toán AI: hạ tầng ngày càng được thiết kế như một hệ thống tích hợp hoàn chỉnh.
Thay vì bán chip rời, Nvidia đang đóng gói CPU, GPU, mạng, DPU và phần mềm thành một nền tảng “AI factory”. Thế hệ Rubin tiếp tục triết lý này bằng cách kết hợp nhiều loại chip tùy biến trong một hệ thống rack‑scale thống nhất.
Nếu các cải thiện hiệu năng đạt như Nvidia tuyên bố, CPU Vera có thể đóng vai trò quan trọng trong cách các trung tâm dữ liệu AI tương lai được xây dựng — nơi CPU, GPU, mạng và phần mềm được thiết kế cùng nhau ngay từ đầu.
Comments
0 comments