Der Wechsel von HBM3e (Blackwell-Generation) zu HBM4 ist keine Evolution, er markiert den größten Leistungssprung der neuen Plattform. Mit ~22 TB/s pro GPU liefert Rubin etwa die 5- bis 6-fache Speicherbandbreite der Blackwell B200, die mit HBM3e noch bei rund 4 TB/s lag .
Dieser massive Durchsatz ist die Grundlage für deutlich effizienteres Training und Inferenz großer KI-Modelle. NVIDIA selbst spricht auf Rack-Ebene von einer 5-fachen Inferenzleistung und 90 % geringeren Kosten pro Token im Vergleich zu Blackwell-Lösungen . Supermicro setzt mit den DCBBS-Blaupausen darauf, bis zu 10-mal mehr Durchsatz pro Watt und ein Zehntel der Token-Kosten zu erreichen
. Ein Wert, der weit über die reine Hardware-Verbesserung hinausgeht und erst durch das perfekte Zusammenspiel von Kühlung, Stromversorgung und Vernetzung möglich wird.
Das Flaggschiff ist ein Rack, das als ein einziger, flüssigkeitsgekühlter Beschleuniger arbeitet. 72 Rubin-GPUs und 36 Vera-CPUs werden über NVLink 6, ConnectX-9 SuperNICs, BlueField-4 DPUs und Spectrum-X Ethernet zu einer kohärenten Einheit verbunden . Alles, was im Rack passiert, ist als integriertes System konzipiert – von der Rechenleistung bis zur Netzwerkstruktur.
Für Umgebungen, die eine andere Form von Flexibilität benötigen, bietet Supermicro das 2U-System HGX Rubin NVL8 mit 8 Rubin-GPUs an . Es unterstützt sowohl die neuen Vera-CPUs von NVIDIA als auch kommende x86-Prozessoren von AMD und Intel – eine wichtige Option für Betreiber, die ihre CPU-Architektur beibehalten wollen. In einem Rack können so bis zu 72 Rubin-GPUs untergebracht werden.
Ein wichtiges Detail: Für Rechenzentren, die bisher keine Flüssigkeitskühlung haben, bietet Supermicro die DCBBS Liquid-to-Air (L2A) Sidecar CDU an . Diese Einheit wird seitlich am Rack angebracht und kühlt das System, ohne dass eine flüssigkeitsgekühlte Gebäudeinfrastruktur nötig ist.
Die thermische Belastung dieser Plattform macht eine klassische Luftkühlung unmöglich. Supermicro hat deshalb einen vollständigen DLC-2 (Direct Liquid Cooling) Stack in die Blaupausen integriert, der auf nahezu 100 % Wärmeaufnahme direkt am Chip, hohe Energieeffizienz und einen leisen Betrieb ausgelegt ist. Der Stack umfasst die folgenden Komponenten aus einer Hand :
Dieser Stack ist nicht optional, er ist integraler Bestandteil der DCBBS-Blaupausen. Betreiber erhalten ein thermisch durchdesigntes Gesamtsystem, bei dem keine Komponente isoliert betrachtet werden muss.
Eine skalierbare GPU-Plattform braucht eine robuste und ausfallsichere Stromversorgung. Die Blaupausen integrieren:
Die DCBBS-Blaupausen sind mehr als eine Hardware-Stückliste. Supermicro verspricht ein echtes Turnkey-Modell, das den gesamten Lebenszyklus abdeckt :
Kunden können ab sofort in die Planung einsteigen. Die ersten Systeme werden parallel zur allgemeinen Verfügbarkeit der NVIDIA-Vera-Rubin-Plattform in der zweiten Jahreshälfte 2026 ausgeliefert – ein klarer Zeitplan, der zeigt, dass es sich hier nicht um langfristige Visionen, sondern um unmittelbar umsetzbare Baupläne handelt .
Comments
0 comments