Venice dibangun di atas mikroarsitektur Zen 6 AMD dan menandai lompatan generasi yang signifikan . Chip ini pindah ke soket SP7 baru dan membawa serta serangkaian peningkatan teknis substansial.
Di kelas atas, Venice menawarkan hingga 256 core per soket—peningkatan signifikan dari 192 core milik Turin . Bandwidth memori melonjak dari 614 GB/dtk menjadi 1,6 TB/dtk, peningkatan 2,6 kali lipat, berkat pengontrol memori DDR5 16 saluran baru dan perpindahan ke PCIe 6.0, yang melipatgandakan bandwidth CPU-ke-GPU
.
AMD mengklaim sekitar 70% peningkatan performa dan efisiensi komputasi dibandingkan generasi EPYC Turin saat ini, bersamaan dengan sekitar 1,3x kepadatan thread yang lebih tinggi dalam jejak soket yang sama . Perusahaan juga memperkenalkan pengemasan 2.5D berbasis EFB untuk meningkatkan bandwidth interkoneksi antar chiplet
.
Produksi dimulai di fasilitas TSMC di Taiwan pada 20 Mei 2026, dan AMD berencana untuk memperluas manufaktur ke kampus TSMC di Arizona pada akhir 2026 . Pengiriman ke pelanggan diharapkan pada paruh kedua tahun ini, sejalan dengan penyebaran rack Helios pertama
.
Helios mewakili langkah AMD ke dalam desain tingkat sistem, skala rack untuk AI dan HPC. Sebelumnya digambarkan sebagai cetak biru perusahaan untuk infrastruktur "skala yotta", Helios mengintegrasikan CPU Venice, GPU Instinct MI455X, dan jaringan Pensando ke dalam rak double-width berpendingin cairan yang dapat menghasilkan hingga 2,9 exaflop komputasi AI .
Satu rak Helios menampung 72 akselerator Instinct MI455X bersama dengan 4.600 core CPU dan 18.000 unit komputasi GPU, dihubungkan oleh memori HBM4 sebesar 31 TB . GPU MI455X menggunakan teknologi proses 2nm dan 3nm serta pengemasan chiplet 3D, dengan masing-masing akselerator menyediakan sekitar 40 petaflop performa inferensi FP4 padat
.
Meta telah berkomitmen sebagai mitra penyebaran besar pertama, dengan perjanjian 6-gigawatt yang mencakup beberapa generasi GPU dan penyebaran gigawatt pertama dijadwalkan pada paruh kedua tahun 2026 .
Di balik pengumuman perangkat keras, AMD membuat argumen strategis yang lebih penting: AI agentic sedang menulis ulang ekonomi permintaan CPU di dalam pusat data.
Beban kerja AI tradisional—inferensi model tunggal atau proses pelatihan—biasanya menggunakan satu CPU untuk menghosting empat, lima, atau bahkan delapan GPU. Tugas CPU relatif ringan dalam konfigurasi itu. Tetapi beban kerja AI agentic secara fundamental berbeda. Alih-alih kueri tunggal, sistem agentic menjalankan alur kerja multi-langkah yang melibatkan perencanaan, penggunaan alat, manajemen memori, penjadwalan, dan koordinasi di berbagai model dan sumber data. Semua orkestrasi itu berjalan pada CPU serba guna.
"Inferensi dan AI agentic secara fundamental meningkatkan persyaratan komputasi, mendorong penyebaran akselerator skala lebih besar dan secara signifikan meningkatkan komputasi CPU," kata CEO AMD Lisa Su selama panggilan pendapatan Q1 2026 .
Analisis internal AMD kini memproyeksikan rasio CPU-ke-GPU akan mengetat dari kisaran saat ini 4–5:1 menjadi mendekati 1:1 seiring dengan berkembangnya AI agentic . Dalam beberapa kasus, Su menyarankan rasionya bahkan bisa berbalik, dengan lebih banyak CPU daripada GPU per node jika penyebaran agen menjadi cukup padat
.
Ini bukan hanya tesis AMD. Intel telah membuat pernyataan serupa, mencatat bahwa rasionya bisa mengetat menjadi 1:1 dalam skenario agentic, dan analisis pihak ketiga dari TrendForce memperkirakan peningkatan empat kali lipat dalam persyaratan core CPU per gigawatt kapasitas pusat data di era AI Agent .
Implikasi pasarnya signifikan. AMD telah melipatgandakan perkiraan total pasar CPU server yang dapat dituju dari sekitar $60 miliar menjadi $120 miliar pada tahun 2030, kini memproyeksikan pertumbuhan tahunan lebih dari 35% alih-alih 18% sebelumnya . Kekurangan CPU server telah muncul pada tahun 2026, didorong oleh pembangunan infrastruktur AI agentic dan siklus penyegaran perusahaan yang bertabrakan dengan kapasitas manufaktur yang terbatas
.
Investor merespons dengan cepat cerita permintaan CPU ini. Saham AMD melonjak 19% ke rekor sekitar $421 setelah laporan pendapatan Q1 2026, yang mencakup peningkatan TAM CPU server menjadi $120 miliar . Pasar menafsirkan revisi TAM sebagai bukti pergeseran struktural yang tahan lama, bukan lonjakan permintaan sementara.
Komunitas analis yang lebih luas secara umum bullish pada tesis ini. Argumen bahwa AI agentic menarik tingkat pelampiran CPU yang lebih besar untuk setiap dolar belanja modal AI telah mendorong beberapa firma pihak penjual untuk menaikkan estimasi dan target harga . Catatan spesifik Barclays dan UBS tidak tersedia dalam bukti sumber, tetapi reaksi pasar agregat secara jelas positif, dengan pengetatan rasio CPU-ke-GPU disebut sebagai katalis inti.
Peran Supermicro di Computex 2026 lebih dari sekadar etalase mitra standar. Perusahaan ini adalah salah satu mitra pertama yang membawa Helios ke pasar dan menggunakan stan Computex untuk mendemonstrasikan rak 72-GPU double-width yang beroperasi penuh, dibangun di atas arsitektur Solusi Blok Bangunan Pusat Data miliknya .
Sistem ini menggabungkan GPU Instinct MI455X, CPU EPYC Venice Generasi ke-6, dan smartNIC dan DPU Pensando, disatukan di bawah tumpukan perangkat lunak ROCm terbuka AMD . Ini menargetkan beban kerja pelatihan AI skala besar, inferensi, AI Berdaulat, dan penyempurnaan LLM, dengan skalabilitas modular dari satu rak hingga penyebaran klaster penuh
.
Demonstrasi tersebut membuat pernyataan yang jelas: Helios bukanlah platform kertas. Ini adalah sistem nyata yang dapat digunakan dengan dukungan ekosistem dari OEM utama, dan diposisikan untuk bersaing dalam kontrak infrastruktur AI hyperscale dan NeoCloud mulai akhir tahun ini.
Acara musim gugur khas AMD, Advancing AI, adalah tempat alami untuk gelombang pengungkapan besar berikutnya. Dengan Venice yang sudah dalam produksi dan penyebaran Helios dijadwalkan untuk paruh kedua tahun 2026, pengumuman yang paling dinantikan termasuk spesifikasi akhir dan harga SKU Venice, detail arsitektur yang lebih dalam pada GPU MI450X dan MI455X, kemenangan pelanggan Helios di luar Meta, dan pratinjau prosesor EPYC 'Verano' generasi berikutnya yang dikonfirmasi untuk tahun 2027 .
Arsitektur referensi AI agentic yang diperluas juga kemungkinan akan muncul, menunjukkan secara lebih rinci bagaimana AMD mengharapkan rak CPU-server untuk berintegrasi dengan infrastruktur GPU seiring industri beralih ke rasio CPU-ke-GPU yang lebih padat.
Pesan AMD di Computex 2026 jelas: perusahaan percaya pusat data akan mulai mengonsumsi CPU dengan kecepatan yang tidak dapat ditangkap oleh perkiraan mana pun. Venice dan Helios dibangun untuk memenuhi momen itu.
Comments
0 comments