Nvidias Vera CPU: Die neue Prozessorbasis für die nächste Generation von KI‑Rechenzentren
Nvidias neue Vera CPU ist ein Arm‑basierter Rechenzentrumsprozessor für KI‑Workloads und Teil der Rubin‑NVL72‑Plattform mit 72 GPUs und 36 CPUs; erste Systeme wurden an Anthropic, OpenAI, SpaceXAI und Oracle Cloud aus... Der Chip dient als Orchestrierungs‑ und Speicherzentrale für KI‑Workflows wie Agenten‑Systeme, R...
What is Nvidia’s new Vera CPU, which AI companies and cloud providers have received the first units, what technical features and performanceNvidia’s Vera CPU is designed to work alongside Rubin GPUs in rack‑scale AI systems built for large‑scale agentic AI workloads.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What is Nvidia’s new Vera CPU, which AI companies and cloud providers have received the first units, what technical features and performance. Article summary: Nvidia’s Vera CPU is a new in-house data-center processor built to sit beside Rubin GPUs in Nvidia’s next rack-scale AI systems, with Nvidia positioning it specifically for agentic AI, reinforcement learning, retrieval, . Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs | The Tech Buzz. The first NVIDIA Vera CPUs arrived at three of the world's leading AI labs on Friday — Anthr" source context "Vera Arrives: NVIDIA's First CPU Built for Agents Lands at Top AI Labs" Reference image 2: visual subject "### NVIDI
openai.com
Nvidia hat mit der Vera CPU erstmals einen eigenen Prozessor vorgestellt, der speziell für moderne KI‑Rechenzentren entwickelt wurde. Der Chip wurde gemeinsam mit der neuen Rubin‑GPU‑Architektur präsentiert und bildet die CPU‑Basis der kommenden Generation von Nvidia‑Systemen für große KI‑Modelle und sogenannte agentische KI – Systeme, bei denen KI‑Modelle eigenständig Werkzeuge nutzen, mehrere Schritte planen und komplexe Arbeitsabläufe ausführen.
Die CPU ist ein zentraler Baustein der Plattform Vera Rubin, mit der Nvidia CPUs, GPUs, Netzwerk‑Hardware und Software zu einer integrierten Infrastruktur für große Trainings‑ und Inferenz‑Cluster bündelt.
Erste Kunden: Welche Unternehmen bereits Vera‑Systeme erhalten haben
Im Mai 2026 lieferte Nvidia die ersten Systeme mit Vera‑CPU an mehrere führende KI‑Organisationen und Cloud‑Betreiber aus. Zu den ersten Empfängern gehörten laut Nvidia:
Anthropic (San Francisco)
OpenAI (Mission Bay, San Francisco)
SpaceXAI (Palo Alto)
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Wie lautet die kurze Antwort auf „Nvidias Vera CPU: Die neue Prozessorbasis für die nächste Generation von KI‑Rechenzentren“?
Nvidias neue Vera CPU ist ein Arm‑basierter Rechenzentrumsprozessor für KI‑Workloads und Teil der Rubin‑NVL72‑Plattform mit 72 GPUs und 36 CPUs; erste Systeme wurden an Anthropic, OpenAI, SpaceXAI und Oracle Cloud aus...
Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?
Nvidias neue Vera CPU ist ein Arm‑basierter Rechenzentrumsprozessor für KI‑Workloads und Teil der Rubin‑NVL72‑Plattform mit 72 GPUs und 36 CPUs; erste Systeme wurden an Anthropic, OpenAI, SpaceXAI und Oracle Cloud aus... Der Chip dient als Orchestrierungs‑ und Speicherzentrale für KI‑Workflows wie Agenten‑Systeme, Retrieval‑Abfragen und Reinforcement‑Learning, während Rubin‑GPUs die eigentlichen Matrix‑ und Tensorberechnungen übernehmen.
Was soll ich als nächstes in der Praxis tun?
Mit Vera will Nvidia nicht mehr nur GPUs liefern, sondern komplette „AI‑Factory“ Infrastruktur – und tritt damit stärker gegen Server‑CPUs von AMD (EPYC) und Intel (Xeon) an.
Die ersten Chips wurden sogar persönlich von Nvidias VP für Hyperscale‑ und HPC‑Systeme, Ian Buck, an Partner ausgeliefert.
Diese Organisationen testen die neue Architektur bereits als Teil von Infrastruktur für große KI‑Modelle und kommende Agent‑basierte Anwendungen.
Wofür die Vera CPU gebaut wurde
Während klassische Server‑CPUs vor allem allgemeine Cloud‑Workloads bedienen, richtet Nvidia Vera speziell auf KI‑Infrastruktur aus.
Moderne KI‑Systeme bestehen aus vielen Komponenten rund um ein Modell. Dazu gehören etwa:
Agenten‑Orchestrierung und Planungs‑Schleifen
Retrieval‑Augmented‑Generation und Datenbankabfragen
Reinforcement‑Learning‑Simulationen
Tool‑Aufrufe, Sandboxes und mehrstufige Reasoning‑Prozesse
Diese Aufgaben laufen häufig auf CPUs und müssen sehr schnell mit GPUs kommunizieren. Genau dafür wurde Vera optimiert.
Technische Architektur der Vera CPU
Öffentlich bekannte Spezifikationen zeigen, dass Vera ein Arm‑basierter Rechenzentrumsprozessor mit Nvidia‑eigenen CPU‑Kernen ist.
Wichtige Merkmale:
88 Armv9.2‑„Olympus“-Kerne
176 Threads durch Spatial Multithreading
Speicherbandbreite von rund 1,2 TB/s
NVLink‑C2C‑Verbindung zu GPUs mit bis zu etwa 1,8 TB/s
Die CPU fungiert dabei vor allem als Koordinations‑ und Speicherzentrale, während die Rubin‑GPUs die eigentlichen KI‑Berechnungen (Tensor‑ und Matrixoperationen) durchführen.
Der Chip folgt Nvidias Strategie, auf eigene Arm‑basierte Server‑CPUs zu setzen. Zuvor hatte das Unternehmen bereits den Grace‑Prozessor für seine Grace‑Hopper‑Plattform entwickelt.
Leistungsversprechen für Agent‑basierte KI
Nvidia positioniert Vera vor allem für Workloads, bei denen viele KI‑Komponenten zusammenarbeiten müssen.
Laut Herstellerbenchmarks kann Vera unter anderem bieten:
bis zu doppelte Effizienz gegenüber traditionellen Rack‑CPUs
etwa 50 % höhere Leistung in bestimmten Workloads
bis zu 50 % schnellere Agent‑Sandbox‑Ausführung
bis zu dreimal schnellere Unternehmens‑Datenabfragen
Diese Zahlen stammen aus Nvidia‑eigenen Tests und wurden bislang nur begrenzt unabhängig überprüft. Sie gelten daher als Herstellerangaben und nicht als endgültige Marktvergleiche.
Rolle in der Rubin‑NVL72‑Plattform
Die Vera CPU ist nicht als Einzelprozessor gedacht. Sie ist Teil der Vera‑Rubin‑Architektur, einer vollständig integrierten KI‑Plattform.
Das Flaggschiff ist das Vera Rubin NVL72‑Rack, ein Rack‑Scale‑System für große KI‑Cluster. Es kombiniert:
72 Rubin GPUs
36 Vera CPUs
NVLink‑6‑Switch‑Fabric
ConnectX‑9 SuperNIC‑Netzwerkadapter
BlueField‑4 DPUs
Hochgeschwindigkeits‑Netzwerke über Quantum‑X800 InfiniBand oder Spectrum‑X Ethernet
Gemeinsam bilden diese Komponenten praktisch einen kompletten KI‑Supercomputer in einem Rack, der für Training, Inferenz und agentische Workloads ausgelegt ist.
Darüber hinaus stellte Nvidia auch CPU‑Racks mit bis zu 256 flüssigkeitsgekühlten Vera‑CPUs vor, die besonders für Reinforcement‑Learning‑Simulationen oder Orchestrierungsaufgaben in großen Clustern gedacht sind.
Warum der Launch strategisch wichtig für Nvidia ist
Bisher dominierte Nvidia den KI‑Markt vor allem über GPUs. Doch große KI‑Systeme bestehen aus deutlich mehr Komponenten als nur Beschleunigerchips.
Mit Vera baut Nvidia seine Rolle zu einem Anbieter kompletter KI‑Infrastruktur‑Stacks aus – inklusive:
CPUs
GPUs
Netzwerk‑Hardware
Datenverarbeitungs‑Einheiten (DPUs)
Software‑Ökosystemen wie CUDA
Das Ziel: komplette „AI‑Factories“, also integrierte Plattformen für Training und Betrieb großer Modelle.
Wettbewerb mit AMD und Intel
Mit Vera betritt Nvidia indirekt auch den klassischen Server‑CPU‑Markt, der bisher hauptsächlich von Intel Xeon und AMD EPYC dominiert wird.
Der Wettbewerb hat sich zuletzt verschärft. Laut Daten von Mercury Research, berichtet von Tom’s Hardware, erreichte AMD Anfang 2026 über 33 % Marktanteil bei Server‑CPU‑Stückzahlen und rund 46 % Anteil am x86‑Server‑Umsatz.
Indem Nvidia eigene CPUs in seine KI‑Racks integriert, kann das Unternehmen:
weniger von externen CPU‑Herstellern abhängig sein
seine GPU‑Cluster enger integrieren
mehr Wertschöpfung innerhalb der eigenen Plattform behalten
Die Einführung der Vera CPU zeigt einen grundlegenden Wandel in der KI‑Hardwarebranche.
Statt einzelne Chips zu verkaufen, bauen Hersteller zunehmend komplett integrierte Rechenplattformen, bei denen CPUs, GPUs, Netzwerk und Software gemeinsam entwickelt werden.
Die Rubin‑Generation ist genau auf diese Idee ausgelegt: ein vollständig abgestimmtes System für riesige KI‑Modelle, autonome Agenten und zukünftige Anwendungen mit extremem Rechenbedarf.
Sollten sich Nvidias Leistungsversprechen bestätigen, könnte Vera maßgeblich beeinflussen, wie kommende KI‑Rechenzentren aufgebaut werden – nämlich als eng integrierte Plattformen statt als lose zusammengestellte Server‑Cluster.
Comments
0 comments