Venice jest zbudowany na mikroarchitekturze AMD Zen 6 i stanowi znaczący skok generacyjny . Układ przechodzi na nowe gniazdo SP7 i wprowadza solidny zestaw ulepszeń technicznych.
W najwyższej konfiguracji Venice oferuje do 256 rdzeni na gniazdo – to znaczny wzrost w porównaniu do 192 rdzeni w Turynie . Przepustowość pamięci wzrasta z 614 GB/s do 1,6 TB/s, co oznacza 2,6-krotną poprawę, dzięki nowemu 16-kanałowemu kontrolerowi pamięci DDR5 i przejściu na magistralę PCIe 6.0, która podwaja przepustowość CPU-GPU
.
AMD deklaruje około 70% lepszą wydajność obliczeniową i efektywność w porównaniu do obecnej generacji EPYC Turin, a także około 1,3 razy większe zagęszczenie wątków przy tej samej powierzchni gniazda . Firma wprowadza również opakowanie 2.5D oparte na technologii EFB, aby zwiększyć przepustowość połączeń między chipletami
.
Produkcja rozpoczęła się w zakładzie TSMC na Tajwanie 20 maja 2026 roku, a AMD planuje rozszerzyć produkcję do kampusu TSMC w Arizonie jeszcze w 2026 roku . Dostawy do klientów spodziewane są w drugiej połowie roku, w jednym czasie z pierwszymi wdrożeniami szaf Helios
.
Helios to wejście AMD w projektowanie systemów na poziomie całej szafy dla AI i HPC. Wcześniej opisywana jako plan firmy na infrastrukturę w „skali jottaskalarnej”, Helios integruje procesory Venice, akceleratory GPU Instinct MI455X i sieci Pensando w chłodzonej cieczą, podwójnie szerokiej szafie, która może dostarczyć do 2,9 eksaflopsa mocy obliczeniowej AI .
Pojedyncza szafa Helios mieści 72 akceleratory Instinct MI455X, a także 4600 rdzeni CPU i 18 000 jednostek obliczeniowych GPU, połączonych przez 31 TB pamięci HBM4 . Akceleratory MI455X wykorzystują zarówno procesy technologiczne 2 nm, jak i 3 nm oraz trójwymiarowe pakowanie chipletów, a każdy z nich zapewnia około 40 petaflopsów wydajności wnioskowania w gęstym formacie FP4
.
Meta już zobowiązała się jako pierwszy główny partner wdrożeniowy, z umową na 6 gigawatów obejmującą wiele generacji GPU, a pierwsze wdrożenie o mocy gigawata zaplanowano na drugą połowę 2026 roku .
Za ogłoszeniami sprzętowymi kryje się znacznie ważniejszy argument strategiczny AMD: agentowa AI przepisuje ekonomię popytu na procesory CPU w centrum danych.
Tradycyjne obciążenia AI – pojedyncze zapytania do modelu lub serie treningowe – zazwyczaj wykorzystują jeden procesor CPU do obsługi czterech, pięciu, a nawet ośmiu akceleratorów GPU. W takiej konfiguracji zadanie CPU jest stosunkowo lekkie. Jednak obciążenia związane z agentową AI są fundamentalnie inne. Zamiast pojedynczego zapytania, systemy agentowe wykonują wieloetapowe przepływy pracy obejmujące planowanie, wykorzystanie narzędzi, zarządzanie pamięcią, harmonogramowanie i koordynację wielu modeli oraz źródeł danych. Cała ta orkiestracja działa na procesorach ogólnego przeznaczenia.
„Wnioskowanie i agentowa AI fundamentalnie zwiększają wymagania obliczeniowe, napędzając zarówno wdrożenia akceleratorów na większą skalę, jak i znacząco więcej obliczeń CPU” – powiedziała Lisa Su, dyrektor generalna AMD, podczas rozmowy telefonicznej dotyczącej wyników za I kwartał 2026 r. .
Wewnętrzna analiza AMD przewiduje obecnie, że proporcja CPU do GPU zmniejszy się z obecnego zakresu 4–5:1 do około 1:1 w miarę skalowania agentowej AI . W niektórych przypadkach Su zasugerowała, że proporcja może się nawet odwrócić, dając więcej CPU niż GPU na węzeł, jeśli wdrożenia agentów staną się wystarczająco gęste
.
Nie jest to jedynie teza AMD. Intel wygłosił podobne komentarze, zauważając, że proporcja może się zawęzić do 1:1 w scenariuszach agentowych, a analiza zewnętrznej firmy TrendForce przewiduje czterokrotny wzrost zapotrzebowania na rdzenie CPU na gigawat mocy centrum danych w erze AI Agentów .
Implikacje rynkowe są znaczące. AMD podwoiło swoją prognozę całkowitego rynku dostępnego dla serwerowych CPU z około 60 miliardów dolarów do 120 miliardów dolarów do 2030 roku, przewidując obecnie lepszy niż 35% roczny wzrost zamiast wcześniejszych 18% . Już w 2026 roku pojawił się niedobór serwerowych procesorów, spowodowany zderzeniem inwestycji w infrastrukturę agentowej AI i cykli odświeżania w przedsiębiorstwach z ograniczonymi mocami produkcyjnymi
.
Inwestorzy szybko zareagowali na historię popytu na CPU. Notowania AMD wzrosły o 19% do rekordowego poziomu około 421 dolarów po raporcie o wynikach za I kwartał 2026 r., który zawierał podniesienie prognozy całkowitego rynku dostępnego dla serwerowych CPU do 120 miliardów dolarów . Rynek zinterpretował rewizję całkowitego rynku dostępnego (TAM) jako dowód trwałej, strukturalnej zmiany, a nie tymczasowego skoku popytu.
Szersza społeczność analityków ogólnie przyjęła tę tezę z optymizmem. Argument, że agentowa AI zwiększa udział CPU w każdym dolarze wydanym na inwestycje kapitałowe w AI, skłonił wiele firm z branży sprzedaży do podniesienia szacunków i cen docelowych . Konkretne noty Barclays i UBS nie były dostępne w materiale źródłowym, ale zagregowana reakcja rynku była jednoznacznie pozytywna, a kompresję stosunku CPU do GPU uznano za kluczowy katalizator.
Rola Supermicro na Computex 2026 wykraczała poza standardową prezentację partnerską. Firma była jednym z pierwszych partnerów, którzy wprowadzili Heliosa na rynek, i wykorzystała swoje stoisko na Computex do zademonstrowania w pełni operacyjnej, podwójnie szerokiej szafy z 72 akceleratorami GPU, zbudowanej na architekturze Data Center Building Block Solutions .
System łączył akceleratory GPU Instinct MI455X, procesory AMD EPYC Venice 6. generacji oraz inteligentne karty sieciowe i jednostki DPU Pensando, zunifikowane w ramach otwartego stosu oprogramowania AMD ROCm . Jego celem były obciążenia związane z treningiem AI na dużą skalę, wnioskowaniem, Suwerenną AI i dostrajaniem dużych modeli językowych (LLM), z modułową skalowalnością od pojedynczej szafy do pełnych wdrożeń klastrowych
.
Demonstracja była jasnym sygnałem: Helios nie jest platformą „na papierze”. To rzeczywisty, gotowy do wdrożenia system z ekosystemowym wsparciem głównych producentów OEM, który ma konkurować o kontrakty na infrastrukturę AI w hiperskali i NeoCloud, począwszy od końca tego roku.
Jesienne wydarzenie AMD, Advancing AI, jest naturalnym miejscem na ogłoszenie kolejnej dużej fali informacji. Gdy Venice jest już w produkcji, a wdrożenia Heliosa zaplanowano na drugą połowę 2026 roku, do najbardziej oczekiwanych zapowiedzi należą: ostateczne specyfikacje i ceny SKU Venice, głębsze szczegóły architektoniczne akceleratorów MI450X i MI455X, informacje o klientach Heliosa poza Metą oraz zapowiedź procesora EPYC nowej generacji o nazwie „Verano”, potwierdzonego na 2027 rok .
Prawdopodobne są również rozszerzone architektury referencyjne dla agentowej AI, pokazujące bardziej szczegółowo, w jaki sposób AMD spodziewa się zintegrować szafy serwerów CPU z infrastrukturą GPU, w miarę jak branża zmierza w kierunku gęstszego rozmieszczenia CPU względem GPU.
Przesłanie AMD z Computex 2026 było jasne: firma wierzy, że centra danych zaczną konsumować procesory CPU w tempie, którego nie przewidziała żadna prognoza. Venice i Helios są zbudowane tak, by sprostać temu wyzwaniu.
Comments
0 comments