Venice è costruito sulla microarchitettura Zen 6 di AMD e segna un significativo salto generazionale . Il chip si sposta su un nuovo socket SP7 e porta con sé una serie sostanziale di aggiornamenti tecnici.
Nella sua massima espressione, Venice offre fino a 256 core per socket, un aumento significativo rispetto ai 192 core di Turin . La banda di memoria passa da 614 GB/s a 1,6 TB/s, un miglioramento di 2,6 volte, grazie a un nuovo controller di memoria DDR5 a 16 canali e al passaggio al PCIe 6.0, che raddoppia la banda tra CPU e GPU
.
AMD dichiara un miglioramento di circa il 70% nelle prestazioni e nell'efficienza di calcolo rispetto all'attuale generazione EPYC Turin, insieme a una densità di thread circa 1,3 volte superiore nello stesso ingombro del socket . L'azienda sta inoltre introducendo un packaging 2.5D basato su EFB per aumentare la banda di interconnessione tra i chiplet
.
La produzione è iniziata presso lo stabilimento TSMC di Taiwan il 20 maggio 2026 e AMD prevede di espandere la produzione al campus di TSMC in Arizona entro la fine del 2026 . Le spedizioni ai clienti sono previste per la seconda metà dell'anno, in linea con i primi dispiegamenti dei rack Helios
.
Helios rappresenta l'ingresso di AMD nella progettazione a livello di sistema su scala rack per AI e HPC. Precedentemente descritta come il progetto dell'azienda per un'infrastruttura "yotta-scale", Helios integra CPU Venice, GPU Instinct MI455X e la rete Pensando in un rack a doppia larghezza raffreddato a liquido che può erogare fino a 2,9 exaflops di potenza di calcolo AI .
Un singolo rack Helios ospita 72 acceleratori Instinct MI455X insieme a 4.600 core CPU e 18.000 unità di calcolo GPU, connessi da 31 TB di memoria HBM4 . Le GPU MI455X utilizzano tecnologie di processo sia a 2nm che a 3nm e packaging 3D chiplet, con ciascun acceleratore che fornisce circa 40 petaflops di prestazioni dense in FP4 per l'inferenza
.
Meta si è già impegnata come primo grande partner di distribuzione, con un accordo da 6 gigawatt che copre più generazioni di GPU e il primo dispiegamento gigawatt previsto per la seconda metà del 2026 .
Dietro gli annunci hardware, AMD ha fatto un'argomentazione strategica ancora più importante: l'AI agentica sta riscrivendo l'economia della domanda di CPU all'interno del data center.
I carichi di lavoro AI tradizionali, come l'inferenza di un singolo modello o le esecuzioni di addestramento, usano in genere una CPU per gestire quattro, cinque o anche otto GPU. In quella configurazione, il compito della CPU è relativamente leggero. Ma i carichi di lavoro dell'AI agentica sono fondamentalmente diversi. Invece di una singola richiesta, i sistemi agentici eseguono flussi di lavoro a più fasi che coinvolgono pianificazione, uso di strumenti, gestione della memoria, schedulazione e coordinamento tra più modelli e fonti di dati. Tutta questa orchestrazione gira su CPU di uso generale.
"L'inferenza e l'AI agentica stanno aumentando fondamentalmente i requisiti di calcolo, guidando sia dispiegamenti di acceleratori su scala più ampia che una quantità significativamente maggiore di potenza di calcolo della CPU", ha dichiarato l'AD di AMD, Lisa Su, durante la conference call sugli utili del primo trimestre 2026 .
L'analisi interna di AMD ora prevede che il rapporto CPU-GPU si comprima dall'attuale intervallo di 1:4-5 a circa 1:1 man mano che l'AI agentica cresce . In alcuni casi, Su ha suggerito che il rapporto potrebbe persino invertirsi, con più CPU che GPU per nodo se i dispiegamenti di agenti diventano sufficientemente densi
.
Questa non è solo la tesi di AMD. Intel ha fatto dichiarazioni simili, notando che il rapporto potrebbe stringersi a 1:1 in scenari agentici, e un'analisi di terze parti di TrendForce prevede un aumento di quattro volte dei requisiti di core CPU per gigawatt di capacità del data center nell'era dell'AI Agent .
Le implicazioni di mercato sono significative. AMD ha raddoppiato la sua previsione del mercato totale indirizzabile (TAM) per le CPU server da circa 60 miliardi a 120 miliardi di dollari entro il 2030, prevedendo ora una crescita annua superiore al 35% invece del precedente 18% . Una carenza di CPU per server è già emersa nel 2026, guidata dallo sviluppo dell'infrastruttura per l'AI agentica e dai cicli di aggiornamento aziendali che si scontrano con una capacità produttiva limitata
.
Gli investitori hanno risposto rapidamente alla storia della domanda di CPU. Il titolo AMD è salito del 19% raggiungendo un record di circa 421 dollari dopo il rapporto sugli utili del primo trimestre 2026, che includeva l'aggiornamento del TAM delle CPU per server a 120 miliardi di dollari . Il mercato ha interpretato la revisione del TAM come la prova di un cambiamento strutturale duraturo, non di un picco temporaneo della domanda.
La più ampia comunità di analisti è stata generalmente ottimista sulla tesi. L'argomentazione che l'AI agentica aumenta il tasso di utilizzo delle CPU per ogni dollaro di spesa in conto capitale (CAPEX) per l'AI ha spinto diverse società sell-side ad alzare stime e target di prezzo . Note specifiche di Barclays e UBS non erano disponibili nelle fonti raccolte, ma la reazione aggregata del mercato è stata inequivocabilmente positiva, con la compressione del rapporto CPU-GPU citata come catalizzatore principale.
Il ruolo di Supermicro al Computex 2026 è stato più di una semplice dimostrazione standard di un partner. L'azienda è stata uno dei primi partner a portare Helios sul mercato e ha usato il suo stand al Computex per mostrare un rack a doppia larghezza con 72 GPU pienamente operativo, costruito sulla sua architettura Data Center Building Block Solutions .
Il sistema combinava GPU Instinct MI455X, CPU EPYC Venice di sesta generazione e smartNIC e DPU Pensando, il tutto unificato sotto lo stack software aperto ROCm di AMD . Era destinato a carichi di lavoro di addestramento AI su larga scala, inferenza, AI Sovrana e fine-tuning di LLM, con scalabilità modulare da un singolo rack a dispiegamenti di interi cluster
.
La dimostrazione ha lanciato un messaggio chiaro: Helios non è una piattaforma solo sulla carta. È un sistema reale e distribuibile con il supporto dell'ecosistema da parte dei principali OEM, ed è posizionato per competere per i contratti di infrastruttura AI hyperscale e NeoCloud a partire da quest'anno.
L'evento autunnale tipico di AMD, Advancing AI, è la sede naturale per la prossima grande ondata di rivelazioni. Con Venice già in produzione e i dispiegamenti di Helios programmati per la seconda metà del 2026, gli annunci più attesi includono le specifiche finali e i prezzi delle SKU di Venice, dettagli architetturali più approfonditi sulle GPU MI450X e MI455X, nuovi clienti per Helios oltre a Meta e un'anteprima del processore EPYC di nuova generazione 'Verano', confermato per il 2027 .
È anche probabile la presentazione di architetture di riferimento espanse per l'AI agentica, che mostrino più in dettaglio come AMD prevede di integrare i rack di server CPU con l'infrastruttura GPU, mentre l'industria si sposta verso rapporti CPU-GPU più densi.
Il messaggio di AMD al Computex 2026 è stato chiaro: l'azienda crede che il data center stia per consumare CPU a un ritmo che nessuna previsione aveva catturato. Venice e Helios sono costruiti per affrontare questo momento.
Comments
0 comments