"Venice" basiert auf AMDs Zen-6-Mikroarchitektur und markiert einen bedeutenden Generationssprung . Der Chip wechselt auf einen neuen SP7-Sockel und bringt eine Reihe tiefgreifender technischer Verbesserungen mit sich.
In der Spitzenklasse bietet Venice bis zu 256 Kerne pro Sockel – ein deutlicher Anstieg gegenüber den 192 Kernen des Vorgängers Turin . Die Speicherbandbreite katapultiert sich von 614 GB/s auf 1,6 TB/s, eine Steigerung um das 2,6-fache. Ermöglicht wird dies durch einen neuen 16-Kanal-DDR5-Speichercontroller und den Wechsel zu PCIe 6.0, was die Bandbreite zwischen CPU und GPU verdoppelt
.
AMD verspricht rund 70 Prozent mehr Rechenleistung und Effizienz im Vergleich zur aktuellen EPYC-Turin-Generation sowie eine etwa 1,3-fach höhere Thread-Dichte auf derselben Sockelfläche . Das Unternehmen führt zudem ein neues EFB-basiertes 2.5D-Packaging ein, um die Verbindungsbandbreite zwischen den Chiplets zu erhöhen
.
Die Produktion bei TSMC in Taiwan begann offiziell am 20. Mai 2026, und AMD plant, die Fertigung später im Jahr 2026 auf den neuen TSMC-Campus in Arizona auszuweiten . Erste Kundenauslieferungen werden in der zweiten Jahreshälfte erwartet, zeitgleich mit den ersten Helios-Rack-Installationen
.
Helios repräsentiert AMDs Einstieg in das systembasierte Rack-Scale-Design für KI und Hochleistungsrechnen. Ursprünglich als Blaupause für "Yottascale"-Infrastruktur beschrieben, vereint Helios in einem einzigen, flüssigkeitsgekühlten, doppelt breiten Rack Venice-CPUs, Instinct MI455X-GPUs und Pensando-Netzwerklösungen. Das System kann bis zu 2,9 Exaflops an KI-Rechenleistung liefern .
Ein einzelnes Helios-Rack beherbergt 72 Instinct MI455X-Beschleuniger neben 4.600 CPU-Kernen und 18.000 GPU-Recheneinheiten, verbunden durch 31 Terabyte HBM4-Speicher . Die MI455X-GPUs nutzen sowohl modernste 2-nm- als auch 3-nm-Prozesstechnologien und 3D-Chiplet-Packaging. Jeder dieser Beschleuniger liefert rund 40 Petaflops an dichter FP4-Inferenzleistung
.
Meta hat sich bereits als erster großer Partner für die Einführung von Helios verpflichtet. Eine Vereinbarung über insgesamt sechs Gigawatt erstreckt sich über mehrere GPU-Generationen, wobei die erste Gigawatt-Installation für die zweite Jahreshälfte 2026 vorgesehen ist .
Hinter den Hardware-Ankündigungen steckt von AMD ein weitaus bedeutenderes strategisches Argument: Agentic AI wird die Wirtschaftlichkeit der CPU-Nachfrage in den Rechenzentren grundlegend umschreiben.
Traditionelle KI-Workloads – wie einfache Modell-Inferenzen oder Trainingsläufe – nutzen im Verhältnis oft eine CPU als Steuereinheit für vier, fünf oder sogar acht GPUs. Die Aufgabe der CPU in dieser Konstellation ist vergleichsweise leichtgewichtig. Agentic-AI-Workloads funktionieren jedoch grundlegend anders. Statt einer einzelnen Anfrage führen diese Systeme mehrstufige Arbeitsabläufe mit Planung, Tool-Nutzung, Speichermanagement, Terminierung und Koordination über mehrere Modelle und Datenquellen hinweg aus. All diese Orchestrierungsaufgaben laufen auf universellen CPUs.
"Inferencing und Agentic AI steigern den Rechenbedarf fundamental", erklärte AMD-CEO Lisa Su während der Bilanzpressekonferenz zum ersten Quartal 2026. "Dies treibt sowohl größere Beschleuniger-Installationen als auch signifikant mehr CPU-Computing voran."
AMDs interne Analysen gehen nun davon aus, dass sich das CPU-zu-GPU-Verhältnis mit der Skalierung von Agentic AI von den aktuellen 4–5:1 in Richtung von etwa 1:1 komprimieren wird . In einigen Fällen, so Su, könnte sich das Verhältnis sogar umkehren – mit mehr CPUs als GPUs pro Knoten, falls die Agentenbereitstellung dicht genug wird
.
Dies ist nicht nur AMDs These. Intel hat ähnliche Aussagen getroffen und festgestellt, dass sich das Verhältnis in Agentic-Szenarien auf 1:1 verengen könnte. Eine Analyse von Marktforscher TrendForce projiziert sogar eine Vervierfachung der benötigten CPU-Kerne pro Gigawatt Rechenzentrumskapazität im KI-Agenten-Zeitalter .
Die Implikationen für den Markt sind gravierend. AMD hat seine Prognose für den gesamten adressierbaren Markt für Server-CPUs von rund 60 auf 120 Milliarden US-Dollar bis 2030 verdoppelt und erwartet nun ein jährliches Wachstum von über 35 Prozent statt der bisherigen 18 Prozent . Bereits 2026 hat sich ein Engpass bei Server-CPUs eingestellt, da der Aufbau von Agentic-AI-Infrastruktur und unternehmerische Erneuerungszyklen auf eine begrenzte Fertigungskapazität treffen
.
Die Investoren reagierten prompt auf die neue CPU-Nachfragegeschichte. AMDs Aktie schoss nach dem Q1-2026-Bericht um 19 Prozent auf ein Rekordhoch von rund 421 US-Dollar in die Höhe, was die Anhebung der Server-CPU-Marktprognose auf 120 Milliarden US-Dollar beinhaltete . Der Markt interpretierte diese Revision als Beleg für einen dauerhaften strukturellen Wandel und nicht nur als temporären Nachfrageschub.
Die breite Analystengemeinschaft hat die These überwiegend optimistisch aufgenommen. Das Argument, dass jeder für KI-Infrastruktur ausgegebene Dollar eine höhere CPU-Bindungsrate nach sich zieht, hat mehrere Research-Häuser zu erhöhten Schätzungen und Kurszielen veranlasst . Die aggregierte Marktreaktion war eindeutig positiv, wobei die Kompression des CPU-zu-GPU-Verhältnisses als Kernkatalysator identifiziert wurde.
Die Rolle von Supermicro auf der Computex 2026 ging weit über eine Standard-Partnerpräsentation hinaus. Das Unternehmen war einer der ersten Partner, der Helios auf den Markt brachte, und nutzte seinen Messestand, um ein voll funktionsfähiges 72-GPU-Doppelbreit-Rack zu demonstrieren, das auf seiner architekturmodularen "Data Center Building Block Solutions" aufbaut .
Das System kombinierte Instinct MI455X-GPUs, EPYC Venice-CPUs der 6. Generation sowie intelligente Pensando-Netzwerkkarten und DPUs, vereint unter AMDs offenem ROCm-Software-Stack . Es zielte auf groß angelegte KI-Trainings, Inferenzen, "Souveräne KI" und die Feinabstimmung von großen Sprachmodellen ab, mit modularer Skalierbarkeit von einem einzelnen Rack bis hin zu kompletten Cluster-Installationen
.
Die Demonstration sendete eine klare Botschaft: Helios ist keine Papier-Plattform. Es ist ein reales, einsetzbares System mit Ökosystem-Unterstützung von großen Herstellern, das noch in diesem Jahr um Verträge für Hyperscale- und NeoCloud-KI-Infrastruktur konkurrieren wird.
AMDs traditionelle Herbstveranstaltung Advancing AI ist der natürliche Rahmen für die nächste große Welle an Informationen. Da Venice bereits in Produktion ist und Helios-Installationen für die zweite Hälfte 2026 geplant sind, umfassen die am meisten erwarteten Ankündigungen die endgültigen Venice-SKU-Spezifikationen und Preise, tiefere architektonische Details zu den MI450X- und MI455X-GPUs, weitere Helios-Kunden jenseits von Meta sowie eine Vorschau auf den für 2027 bestätigten Prozessor der nächsten Generation mit dem Codenamen "Verano" .
Ebenso wahrscheinlich sind erweiterte Referenzarchitekturen für Agentic AI, die detaillierter zeigen, wie sich die CPU-Server-Racks in die GPU-Infrastruktur integrieren sollen, während sich die Branche zu dichteren CPU-zu-GPU-Verhältnissen verschiebt.
AMDs Botschaft auf der Computex 2026 war unmissverständlich: Das Unternehmen ist überzeugt, dass das Rechenzentrum kurz davor steht, CPUs in einem Tempo zu konsumieren, das keine Prognose erfasst hat. Venice und Helios wurden gebaut, um diesen Moment zu nutzen.
Comments
0 comments