Venice bygger på AMD:s Zen 6-mikroarkitektur och innebär ett markant generationskliv . Kretsen flyttar över till en ny sockel, SP7, och för med sig en rad tunga tekniska uppgraderingar.
I toppkonfiguration erbjuder Venice upp till 256 kärnor per sockel – en rejäl ökning från Turins 192 kärnor . Minnesbandbredden hoppar från 614 GB/s till 1,6 TB/s, en ökning med 2,6 gånger, tack vare en ny 16-kanalers DDR5-minneskontroller och övergången till PCIe 6.0 som dubblerar bandbredden mellan processor och grafikprocessor
.
AMD uppger att Venice levererar ungefär 70 procent bättre beräkningsprestanda och effektivitet jämfört med nuvarande EPYC Turin, tillsammans med omkring 1,3 gånger högre trådtäthet inom samma sockelavtryck . Företaget inför även EFB-baserad 2.5D-paketering för att öka bandbredden mellan chipets olika kretsdelar
.
Produktionen inleddes vid TSMC:s anläggning i Taiwan den 20 maj 2026, och AMD planerar att utöka tillverkningen till TSMC:s campus i Arizona senare under året . De första kundleveranserna väntas under andra halvåret, i linje med de första Helios-utrullningarna
.
Helios är AMD:s intåg på systemnivå, en rackskalig design för AI och högpresterande beräkningar (HPC). Modellen, som tidigare beskrivits som AMD:s ritning för infrastruktur i "yottaskala", integrerar Venice-processorer, Instinct MI455X-grafikprocessorer och Pensando-nätverk i ett vätskekylt, dubbelbrett rack som kan leverera upp till 2,9 exaflops AI-prestanda .
Ett enda Helios-rack rymmer 72 stycken Instinct MI455X-acceleratorer tillsammans med 4 600 processorkärnor och 18 000 GPU-beräkningsenheter, sammanlänkade av 31 TB HBM4-minne . MI455X-grafikprocessorerna använder både 2nm- och 3nm-teknik samt 3D-chiplet-paketering, där varje accelerator ger ungefär 40 petaflops i tät FP4-inferensprestanda
.
Meta har redan tecknat avtal som första stora partner för driftsättning, med en överenskommelse på 6 gigawatt som spänner över flera grafikprocessorgenerationer och den första gigawatt-utbyggnaden planerad till andra halvåret 2026 .
Bakom hårdvarunyttigheterna presenterade AMD ett långt viktigare strategiskt case: agentisk AI håller på att skriva om ekonomin för processorefterfrågan inuti datacentret.
Traditionella AI-arbetslaster – enkelmodells-inferens eller träningskörningar – använder typiskt en processor för att betjäna fyra, fem eller till och med åtta grafikprocessorer. Processorns jobb är förhållandevis lätt i den konstellationen. Men agentiska AI-arbetslaster är fundamentalt annorlunda. I stället för en enstaka fråga kör dessa system arbetsflöden i flera steg med planering, verktygsanvändning, minneshantering, schemaläggning och koordination över flera modeller och datakällor. All denna orkestrering körs på generella processorer.
"Inferens och agentisk AI ökar fundamentalt beräkningsbehoven och driver både större accelerator-utbyggnader och betydligt mer processorkraft," sade AMD:s vd Lisa Su under företagets kvartalsrapport för Q1 2026 .
AMD:s interna analys pekar nu mot att kvoten mellan processorer och grafikprocessorer pressas från dagens 4–5:1 mot ungefär 1:1 i takt med att agentisk AI skalas upp . I vissa fall har Su antytt att kvoten till och med skulle kunna inverteras, med fler processorer än grafikprocessorer per nod om agentdistributionen blir tillräckligt tät
.
Detta är inte bara AMD:s tes – Intel har gjort liknande uttalanden och noterat att kvoten kan stramas åt till 1:1 i agentiska scenarier, och extern analys från TrendForce pekar på en fyrdubbling av antalet processorkärnor per gigawatt datacenterkapacitet i AI-agenternas era .
Marknadskonsekvenserna är betydande. AMD har dubblerat prognosen för den adresserbara serverprocessormarknaden från omkring 60 till 120 miljarder dollar fram till 2030, och räknar nu med en årlig tillväxttakt på över 35 procent . En global brist på serverprocessorer uppstod redan under 2026, driven av utbyggnaden av agentisk AI-infrastruktur och accelererade uppgraderingscykler hos företag som kolliderat med ansträngd tillverkningskapacitet
.
Investerare svarade snabbt på berättelsen om processorbehovet. AMD:s aktie rusade 19 procent till en rekordnivå omkring 421 dollar efter kvartalsrapporten, vilken innehöll uppjusteringen av serverprocessormarknaden till 120 miljarder dollar . Marknaden tolkade revideringen som bevis på en varaktig strukturell förändring, inte en tillfällig efterfrågetopp.
Det bredare analytikerkollektivet har i huvudsak varit optimistiskt till tesen. Argumentet att agentisk AI drar med sig en högre processorandel per satsad AI-krona har fått flera säljsidors analytiker att höja sina estimat och riktkurser . Specifika rekommendationer från Barclays och UBS fanns inte tillgängliga i källmaterialet, men den samlade marknadsreaktionen var entydigt positiv, där den krympande processor-till-GPU-kvoten lyftes fram som den centrala katalysatorn.
Supermicros roll under Computex 2026 var mer än ett standardmässigt partnerspår. Företaget var en av de första partnerna att ta Helios till marknaden och använde sin monter för att demonstrera ett fullt fungerande 72-GPU rack i dubbel bredd, byggt på deras modulära Data Center Building Block Solutions-arkitektur .
Systemet kombinerade Instinct MI455X-grafikprocessorer, 6:e generationens EPYC Venice-processorer samt Pensando-smarta nätverkskort och DPU:er, sammanhållna under AMD:s öppna ROCm-mjukvarustack . Det riktade sig mot storskalig AI-träning, inferens, nationella AI-initiativ (Sovereign AI) och finjustering av stora språkmodeller, med modulär skalbarhet från enstaka rack till fullständiga klusterutrullningar
.
Demonstrationen sände ett tydligt budskap: Helios är inte en pappersprodukt. Det är ett verkligt, driftsättningsbart system med ekosystemstöd från stora datacenterleverantörer, och det är positionerat för att konkurrera om kontrakten för storskalig AI-infrastruktur hos hyperskaliga molnoperatörer och så kallade NeoClouds från och med senare i år.
AMD:s sedvanliga höstevent, Advancing AI, är den naturliga arenan för nästa stora våg av avslöjanden. Med Venice redan i produktion och Helios-utrullningar schemalagda till andra halvåret 2026, är de mest emotsedda punkterna slutgiltiga specifikationer och priser för Venice, djupare arkitekturdetaljer kring grafikprocessorerna MI450X och MI455X, Helios-kundvinster utöver Meta samt en förhandstitt på nästa generations EPYC-processor med kodnamnet 'Verano', bekräftad till 2027 .
Utökade referensarkitekturer för agentisk AI är också sannolika, vilka mer detaljerat visar hur AMD förväntar sig att processorracken ska integreras med GPU-infrastrukturen i takt med att branschen rör sig mot allt tätare processor-till-GPU-kvoter.
AMD:s budskap under Computex 2026 var tydligt: företaget tror att datacentret är på väg att konsumera processorer i en takt som ingen prognos fångat. Venice och Helios är byggda för att möta just det ögonblicket.
Comments
0 comments