Venice er bygget på AMDs Zen 6-mikroarkitektur og markerer et markant generationsspring . Chippen flytter til en ny SP7-sokkel og bringer et væsentligt sæt tekniske opgraderinger med sig.
I toppen tilbyder Venice op til 256 kerner pr. sokkel – en betydelig stigning fra Turins 192 kerner . Hukommelsesbåndbredden springer fra 614 GB/s til 1,6 TB/s, en 2,6x forbedring, takket være en ny 16-kanals DDR5-hukommelsescontroller og skiftet til PCIe 6.0, som fordobler CPU-til-GPU-båndbredden
.
AMD hævder ca. 70 % bedre regnekraft og effektivitet i forhold til den nuværende EPYC Turin-generation sammen med ca. 1,3x højere trådtæthed i samme sokkelstørrelse . Virksomheden introducerer også EFB-baseret 2.5D-pakning for at øge interconnect-båndbredden mellem chiplets
.
Produktionen begyndte på TSMC's fabrik i Taiwan den 20. maj 2026, og AMD planlægger at udvide produktionen til TSMC's campus i Arizona senere i 2026 . Kundeforsendelser forventes i anden halvdel af året, i takt med de første Helios rack-udrulninger
.
Helios repræsenterer AMDs indtog i systemniveau, rack-skala design til AI og HPC. Platformen, der tidligere er blevet beskrevet som virksomhedens plan for "yottaskala"-infrastruktur, integrerer Venice-CPU'er, Instinct MI455X-GPU'er og Pensando-netværk i et væskekølet, dobbeltbredt rack, der kan levere op til 2,9 exaflops AI-regnekraft .
Et enkelt Helios-rack rummer 72 Instinct MI455X-acceleratorer sammen med 4.600 CPU-kerner og 18.000 GPU-beregningsenheder, forbundet af 31 TB HBM4-hukommelse . MI455X-GPU'erne bruger både 2nm og 3nm procesteknologi og 3D-chiplet-pakning, hvor hver accelerator giver ca. 40 petaflops tæt FP4-inferensydelse
.
Meta har allerede forpligtet sig som den første store udrulningspartner med en 6-gigawatt-aftale, der spænder over flere GPU-generationer, og den første gigawatt-udrulning er planlagt til anden halvdel af 2026 .
Bag hardware-annonceringerne fremførte AMD et vigtigere strategisk argument: Agentisk AI omskriver økonomien for CPU-efterspørgsel inde i datacentret.
Traditionelle AI-arbejdsbelastninger – enkeltmodel-inferens eller træningskørsler – bruger typisk én CPU til at hoste fire, fem eller endda otte GPU'er. CPU'ens opgave er relativt let i den konfiguration. Men agentiske AI-arbejdsbelastninger er fundamentalt anderledes. I stedet for en enkelt forespørgsel udfører agentiske systemer flertrins arbejdsgange, der involverer planlægning, værktøjsbrug, hukommelsesstyring, planlægning og koordinering på tværs af flere modeller og datakilder. Al den orkestrering kører på generelle CPU'er.
"Inferens og agentisk AI øger fundamentalt beregningskravene, hvilket driver både større udrulninger af acceleratorer og markant mere CPU-beregning," sagde AMDs administrerende direktør Lisa Su under Q1 2026-regnskabsopkaldet .
AMDs interne analyse forudser nu, at CPU-til-GPU-forholdet komprimeres fra det nuværende 4-5:1 interval mod ca. 1:1, i takt med at agentisk AI skaleres . I nogle tilfælde har Su antydet, at forholdet endda kunne inverteres, med flere CPU'er end GPU'er pr. node, hvis agent-implementeringer bliver tætte nok
.
Dette er ikke kun AMDs tese. Intel har fremsat lignende udtalelser og bemærker, at forholdet kan strammes til 1:1 i agentiske scenarier, og tredjepartsanalyse fra TrendForce forudser en firedobling af CPU-kernekrav pr. gigawatt datacenterkapacitet i AI Agent-æraen .
Markedsimplikationerne er betydelige. AMD har fordoblet sin prognose for det samlede adresserbare marked for server-CPU'er fra ca. 60 milliarder dollars til 120 milliarder dollars inden 2030 og forventer nu bedre end 35 % årlig vækst i stedet for de tidligere 18 % . En mangel på server-CPU'er er allerede opstået i 2026, drevet af oprustning af agentisk AI-infrastruktur og virksomheders opdateringscyklusser, der kolliderer med begrænset produktionskapacitet
.
Investorer reagerede hurtigt på CPU-efterspørgselshistorien. AMDs aktie steg 19 % til en rekord på ca. 421 dollars efter Q1 2026-regnskabet, som inkluderede server-CPU TAM-opgraderingen til 120 milliarder dollars . Markedet fortolkede TAM-revisionen som bevis på et holdbart strukturelt skift, ikke en midlertidig stigning i efterspørgslen.
Det bredere analytikermiljø har generelt været positivt over for tesen. Argumentet om, at agentisk AI trækker en større CPU-tilknytningsrate for hver dollar af AI-capex, har fået flere analysehuse til at hæve estimater og kursmål . Specifikke noter fra Barclays og UBS var ikke tilgængelige i kildebeviserne, men den samlede markedsreaktion var entydigt positiv, med komprimeringen af CPU-til-GPU-forholdet citeret som den centrale katalysator.
Supermicross rolle på Computex 2026 var mere end en standard partnerpræsentation. Virksomheden var en af de første partnere til at bringe Helios på markedet og brugte sin Computex-stand til at demonstrere et fuldt operationelt 72-GPU dobbeltbredt rack bygget på deres Data Center Building Block Solutions-arkitektur .
Systemet kombinerede Instinct MI455X-GPU'er, 6. gen EPYC Venice-CPU'er og Pensando smarte NIC'er og DPU'er, forenet under AMDs åbne ROCm-softwarestak . Det var målrettet stor-skala AI-træning, inferens, suveræn AI og LLM-finetuning-arbejdsbelastninger med modulær skalerbarhed fra et enkelt rack til fulde klynge-implementeringer
.
Demonstrationen afgav en klar erklæring: Helios er ikke en papirplatform. Det er et reelt, implementerbart system med økosystemunderstøttelse fra store OEM'er, og det er positioneret til at konkurrere om hyperskala- og NeoCloud AI-infrastrukturkontrakter fra senere i år.
AMDs typiske efterårsbegivenhed, Advancing AI, er det naturlige sted for den næste store bølge af afsløringer. Med Venice allerede i produktion og Helios-implementeringer planlagt til anden halvdel af 2026, inkluderer de mest ventede annonceringer endelige Venice SKU-specifikationer og priser, dybere arkitektoniske detaljer om MI450X- og MI455X-GPU'erne, Helios-kundetilsagn ud over Meta og en forhåndsvisning af næste generations EPYC 'Verano'-processor, bekræftet til 2027 .
Udvidelser af referencearkitekturer for agentisk AI er også sandsynlige, hvilket i mere detaljer viser, hvordan AMD forventer, at CPU-serverracks integreres med GPU-infrastruktur, efterhånden som industrien skifter mod tættere CPU-til-GPU-forhold.
AMDs budskab på Computex 2026 var klart: Virksomheden tror, at datacentret er ved at forbruge CPU'er i et tempo, som ingen prognose havde fanget. Venice og Helios er bygget til at imødekomme det øjeblik.
Comments
0 comments