喺最高階嘅規格,Venice 每個插槽提供高達 256 個核心——比起 Turin 嘅 192 個核心有顯著提升 。記憶體頻寬由 614 GB/s 躍升到 1.6 TB/s,提升幅度達 2.6 倍,多得全新嘅 16 通道 DDR5 記憶體控制器,同埋轉用 PCIe 6.0,令 CPU 同 GPU 之間嘅頻寬加倍
。
AMD 宣稱,相比現時嘅 EPYC Turin 世代,Venice 嘅運算效能同效率提升咗約 70%,而喺相同插槽尺寸下,線程密度亦提高咗約 1.3 倍 。公司同時引入咗基於 EFB 嘅 2.5D 封裝技術,用嚟提高小晶片之間嘅互連頻寬
。
生產已於 2026 年 5 月 20 號喺台積電嘅台灣廠房開始,AMD 亦計劃喺 2026 年稍後時間,將生產擴展到台積電位於亞利桑那州嘅廠房 。預計 2026 年下半年開始向客戶出貨,時間上同首批 Helios 機架嘅部署一致
。
Helios 代表住 AMD 進軍 AI 同高效能運算嘅系統級、機架級設計。之前被形容為 AMD 邁向「yotta-scale」基礎設施嘅藍圖,Helios 將 Venice CPU、Instinct MI455X GPU 同 Pensando 網絡整合喺一個液冷散熱嘅雙闊度機架入面,可以提供高達 2.9 exaflops 嘅 AI 運算能力 。
單一一個 Helios 機架就容納咗 72 個 Instinct MI455X 加速器,再加上 4,600 個 CPU 核心同 18,000 個 GPU 運算單元,並以 31 TB 嘅 HBM4 記憶體連接 。MI455X GPU 同時採用咗 2nm 同 3nm 製程技術,以及 3D 小晶片封裝,每個加速器可以提供大約 40 petaflops 嘅密集 FP4 推理效能
。
喺硬件發布嘅背後,AMD 提出咗一個更重要嘅策略論據:agentic AI 正在改寫數據中心內部對 CPU 需求嘅經濟法則。
傳統嘅 AI 工作負載——好似單一模型推理或者訓練運行——通常係用一粒 CPU 去帶住四、五,甚至八個 GPU。喺呢種配置下,CPU 嘅工作相對輕巧。但 agentic AI 工作負載就完全唔同。Agentic 系統執行嘅唔係單一查詢,而係涉及規劃、工具使用、記憶體管理、排程同跨多個模型及數據源協調嘅多步驟工作流程。所有呢啲編排工作都要喺通用 CPU 上運行。
AMD 嘅內部分析而家預測,隨住 agentic AI 規模化,CPU 同 GPU 嘅比例會由而家大約 1:4-5,壓縮到趨向約 1:1 。蘇姿丰甚至暗示,喺某啲情況下,如果 agent 部署得夠密集,呢個比例甚至有可能逆轉,變成 CPU 多過 GPU
。
呢個並唔係 AMD 獨有嘅論調。Intel 都發表過類似嘅言論,指出喺 agentic 場景下,比例可能會收窄到 1:1,而嚟自 TrendForce 嘅第三方分析更預測,喺 AI Agent 時代,每 GW 數據中心容量所需嘅 CPU 核心數量會增加四倍 。
市場影響相當重大。AMD 已經將伺服器 CPU 嘅總潛在市場預測,由大約 600 億美元上調一倍到 2030 年嘅 1200 億美元,而家預測年增長率會超過 35%,而唔係之前嘅 18% 。受到 agentic AI 基礎設施建設同企業換代週期嘅雙重夾擊,加上受限嘅製造產能,2026 年已經出現咗伺服器 CPU 短缺嘅情況
。
投資者對 CPU 需求嘅故事反應迅速。喺 AMD 公布 2026 年第一季財報(包括將伺服器 CPU 總潛在市場上調到 1200 億美元)之後,股價大漲 19%,創下大約 421 美元嘅紀錄 。市場將呢次總潛在市場嘅修訂,解讀為一個持久結構性轉變嘅證據,而唔係需求嘅暫時性飆升。
更廣泛嘅分析師社群普遍睇好呢個論調。關於 agentic AI 會令每花一蚊喺 AI 資本支出,都會帶動更大嘅 CPU 附加率呢個論點,促使多家賣方機構上調咗佢哋嘅預估同目標價 。雖然證據中冇包含 Barclays 同 UBS 嘅具體報告,但市場整體反應係一面倒咁正面,而 CPU 同 GPU 比例壓縮被視為核心催化劑。
Supermicro 喺 Computex 2026 扮演嘅角色,唔單止係一個標準嘅合作夥伴展示。Supermicro 係首批將 Helios 推向市場嘅合作夥伴之一,並利用佢哋嘅 Computex 攤位,展示咗一個基於其數據中心模組化解決方案架構、完整運行嘅 72-GPU 雙闊度機架 。
呢個系統結合咗 Instinct MI455X GPU、第 6 代 EPYC Venice CPU 同 Pensando 智能網卡及 DPU,並統一喺 AMD 開放式 ROCm 軟件堆疊之下 。佢嘅目標係處理大規模 AI 訓練、推理、主權 AI 同大型語言模型微調等工作負載,具備由單一機架模組化擴展到完整叢集部署嘅能力
。
呢次展示傳達咗一個明確訊息:Helios 並唔係一個紙上談兵嘅平台。佢係一個真實、可部署嘅系統,得到主要 OEM 廠商嘅生態系統支持,定位係要由今年稍後時間開始,競逐超大規模同新雲端 AI 基礎設施嘅合約。
AMD 每年秋季嘅標誌性活動 Advancing AI,自然係下一波重大資訊披露嘅場合。隨住 Venice 已經投產,而 Helios 部署計劃喺 2026 年下半年展開,最令人期待嘅公告包括:Venice 嘅最終 SKU 規格同定價、MI450X 同 MI455X GPU 更深入嘅架構細節、Meta 以外嘅 Helios 客戶訂單,以及預計喺 2027 年推出嘅下一代 EPYC「Verano」處理器預覽 。
擴展嘅 agentic AI 參考架構都好有可能出現,更詳細展示隨住業界轉向更密集嘅 CPU 對 GPU 比例,AMD 預期 CPU 伺服器機架點樣同 GPU 基礎設施整合。
AMD 喺 Computex 2026 嘅訊息好清晰:公司相信數據中心即將以一個冇任何預測曾捕捉到嘅速度去消耗 CPU。Venice 同 Helios 嘅設計,正係為咗迎接呢個時刻。
Comments
0 comments