Venice is gebouwd op AMD's Zen 6-microarchitectuur en markeert een flinke generatiesprong . De chip maakt gebruik van een nieuwe SP7-socket en introduceert een substantiële reeks technische verbeteringen.
Aan de top biedt Venice tot 256 cores per socket, een forse toename ten opzichte van Turijns 192 cores . De geheugenbandbreedte maakt een sprong van 614 GB/s naar 1,6 TB/s, een verbetering met een factor 2,6. Dit is te danken aan een nieuwe 16-kanaals DDR5-geheugencontroller en de overstap naar PCIe 6.0, wat de bandbreedte tussen CPU en GPU verdubbelt
.
AMD claimt een circa 70% betere rekenprestatie en efficiëntie ten opzichte van de huidige EPYC Turin-generatie, samen met een ongeveer 1,3 keer hogere threaddichtheid in dezelfde socketbehuizing . Het bedrijf introduceert ook EFB-gebaseerde 2.5D-verpakking om de interconnect-bandbreedte tussen chiplets te verhogen
.
De productie startte op 20 mei 2026 in TSMC's Taiwanese fabriek. AMD is van plan de productie later in 2026 uit te breiden naar TSMC's campus in Arizona . Klantleveringen worden in de tweede jaarhelft verwacht, synchroon met de eerste uitrol van Helios-racks
.
Helios vertegenwoordigt AMD's entree in systeemontwerp op rackschaal voor AI en HPC. Eerder bestempeld als AMD's blauwdruk voor "yottaschaal"-infrastructuur, integreert Helios Venice-CPU's, Instinct MI455X GPU's en Pensando-netwerktechnologie in een vloeistofgekoeld, dubbelbreed rack dat tot 2,9 exaflops aan AI-rekenkracht kan leveren .
Eén enkel Helios-rack herbergt 72 Instinct MI455X-versnellers naast 4.600 CPU-cores en 18.000 GPU-rekenkernen, verbonden door 31 TB aan HBM4-geheugen . De MI455X-GPU's maken gebruik van zowel 2nm- als 3nm-procédés en geavanceerde 3D-chipletverpakking. Elke versneller levert ongeveer 40 petaflops aan dichte FP4-inferentieprestaties
.
Meta heeft zich al gecommitteerd als eerste grote implementatiepartner, met een overeenkomst voor 6 gigawatt die meerdere GPU-generaties omspant. De eerste uitrol op gigawattschaal staat gepland voor de tweede helft van 2026 .
Achter de hardware-aankondigingen maakte AMD een veel belangrijker strategisch argument: agentische AI herschrijft de economische spelregels voor de CPU-vraag binnen het datacenter.
Traditionele AI-workloads – zoals het trainen van of inferentie op één enkel model – gebruiken doorgaans één CPU om vier, vijf of zelfs acht GPU's aan te sturen. De taak van de CPU is in die configuratie relatief licht. Maar agentische AI-workloads zijn fundamenteel anders. In plaats van één enkele vraag, voeren agentische systemen meerstaps-workflows uit met planning, gebruik van tools, geheugenbeheer, scheduling en coördinatie over meerdere modellen en databronnen. Al die orkestratie draait op universele CPU's.
"Inferencing en agentische AI zorgen voor een fundamentele toename van de rekenbehoefte, wat leidt tot zowel grootschaligere uitrol van versnellers als significant meer CPU-rekenkracht," aldus AMD-CEO Lisa Su tijdens de presentatie van de Q1 2026 kwartaalcijfers .
AMD's interne analyses voorspellen nu dat de CPU-tot-GPU-verhouding zal verschuiven van de huidige 4-5:1 naar ongeveer 1:1 naarmate agentische AI opschaalt . In sommige gevallen, zo opperde Su, kan de verhouding zelfs omgekeerd worden, met méér CPU's dan GPU's per knooppunt als de dichtheid van AI-agenten hoog genoeg wordt
.
Dit is niet alleen AMD's visie. Intel deed vergelijkbare uitspraken en merkte op dat de verhouding kan krimpen tot 1:1 in agentische scenario's. Onafhankelijke analyse van TrendForce voorspelt een verviervoudiging van de benodigde CPU-cores per gigawatt datacenter-capaciteit in het AI-agent-tijdperk .
De implicaties voor de markt zijn aanzienlijk. AMD heeft zijn prognose voor de totale beschikbare server-CPU-markt verdubbeld van ongeveer $60 miljard naar $120 miljard tegen 2030, en gaat nu uit van een jaarlijkse groei van meer dan 35% in plaats van de eerdere 18% . In 2026 is al een tekort aan server-CPU's ontstaan, doordat de uitbouw van agentische AI-infrastructuur botst met de beperkte productiecapaciteit
.
Beleggers reageerden snel op het verhaal van de stijgende CPU-vraag. Het aandeel AMD schoot met 19% omhoog naar een record van ongeveer $421 na de Q1 2026-resultaten, die de verhoging van de server-CPU-marktprognose naar $120 miljard bevatten . De markt interpreteerde de herziening als bewijs van een duurzame structurele verschuiving en niet als een tijdelijke piek in de vraag.
De bredere analistengemeenschap reageert over het algemeen positief op de stelling. Het argument dat agentische AI leidt tot een hoger CPU-aandeel voor elke dollar aan AI-investeringen, heeft ertoe geleid dat meerdere financiële instellingen hun schattingen en koersdoelen naar boven hebben bijgesteld . Specifieke notities van Barclays en UBS waren niet beschikbaar in het bronmateriaal, maar de totale marktreactie was overduidelijk positief, waarbij de compressie van de CPU-GPU-ratio als de kernkatalysator werd genoemd.
De rol van Supermicro op Computex 2026 was meer dan een standaard partnershowcase. Het bedrijf was een van de eerste partners die Helios op de markt bracht en gebruikte zijn stand om een volledig operationeel, 72 GPU's tellend dubbelbreed rack te demonstreren, gebouwd op zijn Data Center Building Block Solutions-architectuur .
Het systeem combineerde Instinct MI455X GPU's, zesde generatie EPYC Venice-CPU's en Pensando smart NIC's en DPU's, verenigd onder AMD's open ROCm-softwarestack . Het was gericht op grootschalige AI-training, inferentie, soevereine AI en LLM-verfijningsworkloads, met modulaire schaalbaarheid van één rack tot volledige cluster-implementaties
.
De demonstratie maakte één ding duidelijk: Helios is geen 'papieren' platform. Het is een echt, inzetbaar systeem met ecosysteem-ondersteuning van grote OEM's, gepositioneerd om vanaf eind 2026 te concurreren voor contracten voor AI-infrastructuur van hyperscalers en NeoCloud-aanbieders.
AMD's typische najaarsevenement, Advancing AI, is het natuurlijke podium voor de volgende golf van onthullingen. Met Venice al in productie en Helios-uitrol gepland voor de tweede helft van 2026, zijn de meest verwachte aankondigingen: definitieve Venice-SKU-specificaties en prijzen, diepere architectuurbeschrijvingen van de MI450X- en MI455X-GPU's, nieuwe Helios-klanten naast Meta, en een vooruitblik op de volgende generatie EPYC 'Verano'-processor die voor 2027 is bevestigd .
Uitgebreide referentie-architecturen voor agentische AI zijn ook waarschijnlijk, die in meer detail laten zien hoe AMD verwacht dat de CPU-serverracks zullen integreren met GPU-infrastructuur naarmate de industrie verschuift naar hogere CPU-tot-GPU-verhoudingen.
AMD's boodschap op Computex 2026 was helder: het bedrijf gelooft dat het datacenter op het punt staat CPU's te consumeren in een tempo dat geen enkele prognose had voorzien. Venice en Helios zijn gebouwd om aan dat moment te voldoen.
Comments
0 comments