Venice dibina berdasarkan seni bina mikro Zen 6 AMD dan menandakan lonjakan generasi yang ketara . Cip ini beralih ke soket SP7 baharu dan membawa bersamanya satu set peningkatan teknikal yang besar.
Pada tahap tertinggi, Venice menawarkan sehingga 256 teras setiap soket—peningkatan ketara daripada 192 teras Turin . Jalur lebar memori melonjak dari 614 GB/s kepada 1.6 TB/s, peningkatan 2.6 kali ganda, berkat pengawal memori DDR5 16 saluran baharu dan peralihan kepada PCIe 6.0, yang menggandakan lebar jalur CPU-ke-GPU
.
AMD mendakwa kira-kira 70% prestasi pengiraan dan kecekapan yang lebih baik berbanding generasi EPYC Turin semasa, bersama-sama dengan ketumpatan benang kira-kira 1.3x lebih tinggi dalam ruang jejak soket yang sama . Syarikat itu juga memperkenalkan pembungkusan 2.5D berasaskan EFB untuk meningkatkan lebar jalur interkoneksi antara cip kecil
.
Pengeluaran bermula di kemudahan TSMC di Taiwan pada 20 Mei 2026, dan AMD merancang untuk mengembangkan pembuatan ke kampus TSMC Arizona pada akhir 2026 . Penghantaran pelanggan dijangka pada separuh kedua tahun ini, selaras dengan penempatan rak Helios yang pertama
.
Helios mewakili kemasukan AMD ke dalam reka bentuk skala rak peringkat sistem untuk AI dan HPC. Sebelum ini digambarkan sebagai pelan tindakan syarikat untuk infrastruktur "skala yotta", Helios mengintegrasikan CPU Venice, GPU Instinct MI455X, dan rangkaian Pensando ke dalam rak dua lebar yang disejukkan cecair yang boleh menyampaikan sehingga 2.9 exaflop pengiraan AI .
Satu rak Helios menempatkan 72 pemecut Instinct MI455X bersama-sama 4,600 teras CPU dan 18,000 unit pengiraan GPU, dihubungkan oleh 31 TB memori HBM4 . GPU MI455X menggunakan kedua-dua teknologi proses 2nm dan 3nm serta pembungkusan cip kecil 3D, dengan setiap pemecut menyediakan kira-kira 40 petaflop prestasi inferens FP4 padat
.
Meta telah pun komited sebagai rakan kongsi penempatan utama pertama, dengan perjanjian 6 gigawatt merangkumi pelbagai generasi GPU dan penempatan gigawatt pertama dijadualkan pada separuh kedua 2026 .
Di sebalik pengumuman perkakasan, AMD membuat hujah strategik yang lebih penting: AI agentik sedang menulis semula ekonomi permintaan CPU di dalam pusat data.
Beban kerja AI tradisional—inferens model tunggal atau latihan—biasanya menggunakan satu CPU untuk menampung empat, lima, atau lapan GPU. Tugas CPU agak ringan dalam konfigurasi itu. Tetapi beban kerja AI agentik pada asasnya berbeza. Daripada satu pertanyaan, sistem agentik melaksanakan aliran kerja berbilang langkah yang melibatkan perancangan, penggunaan alat, pengurusan ingatan, penjadualan, dan penyelarasan merentasi pelbagai model dan sumber data. Semua orkestrasi itu berjalan pada CPU kegunaan umum.
"Penterjemahan dan AI agentik secara asasnya meningkatkan keperluan pengiraan, mendorong kedua-dua penempatan pemecut skala lebih besar dan lebih banyak pengiraan CPU dengan ketara," kata Ketua Pegawai Eksekutif AMD Lisa Su semasa panggilan pendapatan S1 2026 .
Analisis dalaman AMD kini mengunjurkan nisbah CPU-ke-GPU memampat daripada julat 4–5:1 semasa kepada kira-kira 1:1 apabila AI agentik berskala . Dalam sesetengah kes, Su telah mencadangkan nisbah itu boleh menyongsang, dengan lebih banyak CPU daripada GPU setiap nod jika penempatan ejen menjadi cukup padat
.
Ini bukan sekadar tesis AMD. Intel telah membuat kenyataan serupa, dengan menyatakan bahawa nisbah itu boleh mengetat kepada 1:1 dalam senario agentik, dan analisis pihak ketiga dari TrendForce mengunjurkan peningkatan empat kali ganda dalam keperluan teras CPU setiap gigawatt kapasiti pusat data dalam era Ejen AI .
Implikasi pasaran adalah signifikan. AMD telah menggandakan ramalan jumlah pasaran boleh alamat (TAM) CPU pelayannya daripada kira-kira $60 bilion kepada $120 bilion menjelang 2030, kini mengunjurkan pertumbuhan tahunan lebih baik daripada 35% berbanding 18% sebelumnya . Kekurangan CPU pelayan telah pun muncul pada tahun 2026, didorong oleh pembinaan infrastruktur AI agentik dan kitaran penyegaran perusahaan yang bertembung dengan kapasiti pembuatan yang terhad
.
Pelabur bertindak balas pantas terhadap cerita permintaan CPU. Saham AMD melonjak 19% kepada rekod kira-kira $421 berikutan laporan pendapatan S1 2026, yang termasuk peningkatan TAM CPU pelayan kepada $120 bilion . Pasaran menafsirkan semakan TAM itu sebagai bukti anjakan struktur yang tahan lama, bukan lonjakan sementara dalam permintaan.
Komuniti penganalisis yang lebih luas secara amnya optimis terhadap tesis ini. Hujah bahawa AI agentik menarik kadar lekatan CPU yang lebih besar untuk setiap dolar perbelanjaan modal AI telah mendorong pelbagai firma penjual untuk menaikkan anggaran dan sasaran harga . Nota khusus Barclays dan UBS tidak tersedia dalam bukti sumber, tetapi reaksi pasaran agregat adalah jelas positif, dengan pemampatan nisbah CPU-ke-GPU disebut sebagai pemangkin teras.
Peranan Supermicro di Computex 2026 adalah lebih daripada sekadar pameran rakan kongsi standard. Syarikat itu adalah salah satu rakan kongsi pertama yang membawa Helios ke pasaran dan menggunakan gerai Computexnya untuk menunjukkan rak dua lebar 72 GPU yang beroperasi sepenuhnya, dibina di atas seni bina Penyelesaian Blok Binaan Pusat Datanya .
Sistem ini menggabungkan GPU Instinct MI455X, CPU EPYC Venice Generasi Ke-6, dan NIC pintar serta DPU Pensando, disatukan di bawah timbunan perisian ROCm terbuka AMD . Ia menyasarkan latihan AI skala besar, inferens, AI Berdaulat, dan beban kerja penalaan halus LLM, dengan skalabiliti modular dari satu rak kepada penempatan kluster penuh
.
Demonstrasi itu membuat kenyataan yang jelas: Helios bukanlah platform atas kertas. Ia adalah sistem yang nyata dan boleh diguna pakai dengan sokongan ekosistem daripada OEM utama, dan ia diletakkan untuk bersaing untuk kontrak infrastruktur AI hiperskala dan NeoCloud bermula akhir tahun ini.
Acara musim luruh biasa AMD, Advancing AI, adalah venue semula jadi untuk gelombang utama pendedahan seterusnya. Dengan Venice sudah dalam pengeluaran dan penempatan Helios dijadualkan pada separuh kedua 2026, pengumuman yang paling dinanti-nantikan termasuk spesifikasi dan harga SKU akhir Venice, butiran seni bina yang lebih mendalam pada GPU MI450X dan MI455X, kemenangan pelanggan Helios selain Meta, dan pratonton pemproses EPYC 'Verano' generasi seterusnya yang disahkan untuk 2027 .
Seni bina rujukan AI agentik yang diperluaskan juga berkemungkinan, menunjukkan dengan lebih terperinci bagaimana AMD menjangkakan rak pelayan CPU akan disepadukan dengan infrastruktur GPU apabila industri beralih ke arah nisbah CPU-ke-GPU yang lebih padat.
Mesej AMD di Computex 2026 adalah jelas: syarikat itu percaya pusat data akan menggunakan CPU pada kadar yang tidak dapat ditangkap oleh mana-mana ramalan. Venice dan Helios dibina untuk memenuhi detik itu.
Comments
0 comments