Nvidia hat auf der GTC Taipei am 31. Mai 2026 einen entscheidenden Meilenstein für seine KI-Rechenzentrumsarchitektur gesetzt. Unter dem Motto „Agentic AI Factories“ gab Konzernchef Jensen Huang bekannt, dass die neue Vera-Rubin-Plattform offiziell in die Serienproduktion geht
.
Die Ankündigung ist mehr als ein reines Produktupdate. Vera Rubin ist Nvidias bislang ambitioniertestes Systemdesign und vereint sieben verschiedene Chips in fünf zweckgebundenen Rack-Systemen
. Nur einen Tag später bestätigte der KI-Cloud-Spezialist CoreWeave, der weltweit erste Anbieter zu sein, der die neue Hardware in Betrieb genommen und validiert hat
.
Ein Supercomputer auf fünf Racks verteilt
Anders als herkömmliche Server ist die Vera-Rubin-Plattform ein kompletter POD-Supercomputer, der fünf spezialisierte Rack-Typen zu einem logischen Gesamtsystem verbindet ![]()
:
- Vera Rubin NVL72: Das Herzstück mit 72 Rubin-GPUs und 36 Vera-CPUs, vernetzt über ein 260 TB/s schnelles NVLink-6-Fabric
.
- Vera CPU: Nvidias erste eigenständige Rechenzentrums-CPU auf ARM-Basis, die speziell für autonome KI-Agenten entwickelt wurde und nun in Serie geht
.
- Groq 3 LPX: Ein dediziertes Inferenz-Rack mit Groq-3-LPU-Technologie, das nach einem Lizenzabkommen vom Dezember 2025 integriert wurde
. Es ersetzt eine zuvor geplante Komponente und beschleunigt die Decodierungsphase großer Sprachmodelle.
- Spectrum-6 SPX: Das Ethernet-Switch-Rack, das als Backbone für die Vernetzung des gesamten Systems dient.
- BlueField-4 STX: Das Speicher- und Datenverarbeitungsrack mit dem BlueField-4-Prozessor und ConnectX-9-SuperNIC
.
Dieser modulare Ansatz ermöglicht es, jedes Rack für eine eigene Aufgabe – Training, Inferenz, Netzwerk oder Speicher – zu optimieren, während sie als ein einziger Supercomputer zusammenarbeiten.
Eine Lieferkette von historischem Ausmaß
Nvidia hat für Vera Rubin eine beispiellose Produktion aufgesetzt. Laut Unternehmen sind Hunderte von Partnern im Ökosystem an der Fertigung beteiligt, über 150 davon allein in Taiwan
. Die Produktion läuft in mehr als 350 Fabriken in 30 Ländern – ein deutliches Signal, dass Nvidia sich auf eine massive Nachfrage von KI-Laboren, Cloud-Providern und Hyperscalern vorbereitet ![]()
. Zu den wichtigsten Systembauern, die bereits in die Serienproduktion eingestiegen sind, zählen Dell Technologies, HPE, Lenovo und Supermicro
.
CoreWeave sichert sich die Pole-Position
Nur einen Tag nach der Keynote in Taipeh vermeldete CoreWeave ihr „Industry-First Bring-Up“ eines Vera-Rubin-NVL72-Systems auf ihrer Cloud-Plattform
. Das System liefert nach Angaben des Unternehmens eine bis zu zehnmal bessere Inferenz-Leistung pro Watt im Vergleich zur Vorgängergeneration und benötigt deutlich weniger GPUs für umfangreiche Workloads
.
Die Geschwindigkeit, mit der CoreWeave das System in Betrieb nehmen konnte, unterstreicht die enge Entwicklungspartnerschaft mit Nvidia und positioniert den Cloud-Anbieter als bevorzugten Early-Access-Partner für die Rubin-Generation.
Vera CPU: Der neue Maßstab für KI-Agenten
Ein wichtiges Alleinstellungsmerkmal der Plattform ist die Vera-CPU. Als erste Standalone-Rechenzentrums-CPU von Nvidia ist sie für die spezifischen Lastprofile autonomer KI-Agenten optimiert und in die Massenproduktion gegangen. Erste Auslieferungen werden in der zweiten Jahreshälfte 2026 erwartet ![]()
. Zu den ersten bestätigten Kunden zählen OpenAI, Anthropic und SpaceX
.
Was der Produktionshochlauf für die KI-Infrastruktur bedeutet
Mit dem Übergang zur Serienproduktion für Vera Rubin vollzieht sich ein breiterer Branchenwandel. Gefragt ist nicht mehr nur generative KI, die Antworten erzeugt, sondern „agentische KI“ – Systeme, die logisch denken, planen und mehrstufige Aktionen ausführen können.
Die Integration der Groq-Inferenz-Technologie direkt in das POD-Design zeigt, dass Nvidia gezielt Workloads anvisiert, bei denen es auf extrem niedrige Latenz und hohe Energieeffizienz ankommt
.
Die allgemeine Verfügbarkeit der Plattform ist für die zweite Hälfte 2026 vorgesehen. AWS, Google Cloud, Microsoft Azure und Oracle Cloud Infrastructure werden als erste große Abnehmer erwartet
. Da der Produktionsstart bereits auf der CES im Januar
sowie erneut auf der GTC im März
verkündet wurde, bestätigt das Update aus Taipeh, dass die Fertigung inzwischen in globalem Maßstab auf vollen Touren läuft
.
Comments
0 comments