Venice er bygget på AMDs Zen 6-mikroarkitektur og markerer et betydelig generasjonssprang . Brikken flyttes til en ny SP7-sokkel og bringer med seg en omfattende pakke tekniske oppgraderinger.
I toppkonfigurasjon tilbyr Venice opptil 256 kjerner per sokkel – en markant økning fra Turins 192 kjerner . Minnebåndbredden hopper fra 614 GB/s til 1,6 TB/s, en 2,6 ganger forbedring, takket være en ny 16-kanals DDR5-minnekontroller og overgangen til PCIe 6.0, som dobler båndbredden mellom CPU og GPU
.
AMD hevder omtrent 70 prosent bedre beregningsytelse og -effektivitet sammenlignet med dagens EPYC Turin-generasjon, sammen med rundt 1,3 ganger høyere trådtetthet i samme sokkelformat . Selskapet introduserer også EFB-basert 2.5D-innpakking for å øke båndbredden mellom brikkene
.
Produksjonen startet ved TSMCs anlegg i Taiwan den 20. mai 2026, og AMD planlegger å utvide produksjonen til TSMCs campus i Arizona senere i 2026 . Kundeforsendelser er ventet i andre halvår, i takt med de første Helios-utrullingene
.
Helios representerer AMDs inntog i systemnivå-design i rack-skala for AI og HPC. Tidligere beskrevet som selskapets blåkopi for «yotta-skala»-infrastruktur, integrerer Helios Venice CPU-er, Instinct MI455X GPU-er og Pensando-nettverk i et væskekjølt, dobbelbredde rack som kan levere opptil 2,9 exaflops med AI-beregningskraft .
Ett enkelt Helios-rack huser 72 Instinct MI455X-akseleratorer sammen med 4600 CPU-kjerner og 18 000 GPU-beregningsenheter, bundet sammen av 31 TB HBM4-minne . MI455X GPU-ene bruker både 2nm og 3nm prosessteknologi og 3D brikkepakking, og hver akselerator yter omtrent 40 petaflops med tett FP4-inferensytelse
.
Meta har allerede forpliktet seg som den første store utrullingspartneren, med en avtale på 6 gigawatt som spenner over flere GPU-generasjoner, og den første gigawatt-utrullingen er planlagt i andre halvår 2026 .
Bak maskinvarenyhetene presenterte AMD et langt viktigere strategisk argument: agentisk AI er i ferd med å omskrive økonomien i CPU-etterspørselen inne i datasenteret.
Tradisjonelle AI-arbeidsbelastninger – enkeltmodells inferens eller treningsøkter – bruker typisk én CPU til å betjene fire, fem eller til og med åtte GPU-er. CPU-ens jobb er relativt lett i den konfigurasjonen. Men agentisk AI-arbeidsbelastning er fundamentalt annerledes. I stedet for en enkelt spørring, utfører agentiske systemer flertrinns arbeidsflyter som involverer planlegging, bruk av verktøy, minnehåndtering, tidsplanlegging og koordinering på tvers av flere modeller og datakilder. All denne orkestreringen kjøres på generelle CPU-er.
«Inferens og agentisk AI øker fundamentalt beregningskravene, og driver både større utrullinger av akseleratorer og betydelig mer CPU-beregning,» sa AMD-sjef Lisa Su under inntjeningssamtalen for første kvartal 2026 .
AMDs interne analyser anslår nå at CPU-til-GPU-forholdet vil presses fra dagens 4–5:1-område mot omtrent 1:1 etter hvert som agentisk AI skaleres . I noen tilfeller har Su antydet at forholdet til og med kan bli invertert, med flere CPU-er enn GPU-er per node hvis agent-utrullingen blir tett nok
.
Dette er ikke bare AMDs tese. Intel har kommet med lignende uttalelser og påpekt at forholdet kan strammes inn til 1:1 i agentiske scenarioer, og tredjepartsanalyse fra TrendForce anslår en firedobling i CPU-kjernebehov per gigawatt datasenterkapasitet i AI-agent-æraen .
Markedsimplikasjonene er betydelige. AMD har doblet prognosen for det totale adresserbare markedet for server-CPU fra omtrent 60 milliarder dollar til 120 milliarder dollar innen 2030, og forventer nå bedre enn 35 prosent årlig vekst i stedet for de tidligere 18 prosentene . En mangel på server-CPU har allerede oppstått i 2026, drevet av utbygging av agentisk AI-infrastruktur og sykluser for fornyelse i bedrifter som kolliderer med begrenset produksjonskapasitet
.
Investorer reagerte raskt på etterspørselshistorien for CPU. AMDs aksje skjøt i været med 19 prosent til en rekord på omtrent 421 dollar etter inntjeningsrapporten for første kvartal 2026, som inkluderte oppgraderingen av det totale adresserbare markedet for server-CPU til 120 milliarder dollar . Markedet tolket oppgraderingen som bevis på et varig strukturelt skifte, ikke en midlertidig etterspørselsøkning.
Det bredere analytikermiljøet har generelt vært positive til tesen. Argumentet om at agentisk AI drar med seg en større CPU-andel for hver dollar investert i AI, har fått flere meglerhus til å oppjustere estimater og kursmål . Spesifikke notater fra Barclays og UBS var ikke tilgjengelige i kildebeviset, men den samlede markedsreaksjonen var utvetydig positiv, der kompresjonen i CPU-til-GPU-forholdet ble trukket frem som den sentrale katalysatoren.
Supermicrons rolle på Computex 2026 var mer enn en standard partnerpresentasjon. Selskapet var en av de første partnerne som brakte Helios til markedet, og brukte sin Computex-stand til å demonstrere et fullt operativt 72-GPU dobbelbredde-rack bygget på deres Data Center Building Block Solutions-arkitektur .
Systemet kombinerte Instinct MI455X GPU-er, 6. generasjons EPYC Venice CPU-er, og Pensando smarte NIC-er og DPU-er, samlet under AMDs åpne ROCm-programvarestakk . Det rettet seg mot storskala AI-trening, inferens, suveren AI (Sovereign AI) og finjustering av store språkmodeller (LLM), med modulær skalerbarhet fra ett enkelt rack til fullskala klyngeutrullinger
.
Demonstrasjonen sendte et klart signal: Helios er ikke en papirplattform. Det er et ekte, utrullingsklart system med økosystemstøtte fra store OEM-er, og det er posisjonert for å konkurrere om kontrakter for hyperskala- og NeoCloud AI-infrastruktur senere i år.
AMDs typiske høstarrangement, Advancing AI, er den naturlige arenaen for neste store bølge av avsløringer. Med Venice allerede i produksjon og Helios-utrullinger planlagt i andre halvår 2026, inkluderer de mest etterlengtede kunngjøringene endelige spesifikasjoner og priser for Venice, dypere arkitektoniske detaljer om MI450X- og MI455X GPU-ene, Helios-kunder utover Meta, og en forhåndsvisning av neste generasjons EPYC 'Verano'-prosessor bekreftet for 2027 .
Utvidede referansearkitekturer for agentisk AI er også sannsynlige, som i større detalj viser hvordan AMD forventer at CPU-serverstativene vil integreres med GPU-infrastruktur når industrien skifter mot tettere CPU-til-GPU-forhold.
AMDs budskap på Computex 2026 var klart: selskapet tror datasenteret er i ferd med å konsumere CPU-er i et tempo ingen prognoser har fanget opp. Venice og Helios er bygget for å møte dette øyeblikket.
Comments
0 comments