其顶配规格可提供单路高达256个核心,远超前代产品Turin的192核心 。内存带宽更是从614 GB/s跃升至1.6 TB/s,提升了2.6倍,这得益于全新的16通道DDR5内存控制器,以及转向PCIe 6.0所带来的CPU与GPU间带宽翻倍的成效
。
AMD声称,相较于当前的EPYC Turin,Venice的计算性能和能效提升了约70%,在相同的插槽面积内线程密度也提高了约1.3倍 。该公司还引入了基于EFB的2.5D封装技术,用以提升芯片内部小芯片之间的互连带宽
。
量产已于2026年5月20日在台积电的台湾工厂启动,AMD还计划于2026年晚些时候将制造扩展到台积电位于亚利桑那州的园区 。面向客户的出货预计在下半年开始,与首批Helios机架的部署时间保持同步
。
Helios代表了AMD正式以系统级、整机架设计切入AI和高性能计算领域。此前它一直被描述为公司面向"尧级"(yotta-scale)基础设施的蓝图,如今Helios将Venice CPU、Instinct MI455X GPU和Pensando网络技术集成到一个液冷双宽机架中,能够提供高达2.9 Exaflops的AI算力 。
单个Helios机架内包含72颗Instinct MI455X加速器,搭配4600个CPU核心和18000个GPU计算单元,并通过31TB的HBM4内存进行连接 。MI455X GPU同时采用了2纳米和3纳米工艺技术以及3D小芯片封装,每颗加速器可提供约40 Petaflops的密集FP4推理性能
。
在硬件发布背后,AMD提出了一个更为重要的战略论断:智能体AI正从根本上重写数据中心内部CPU需求的经济学逻辑。
传统的AI工作负载,如单模型推理或训练任务,通常使用一颗CPU来带动四颗、五颗甚至八颗GPU。在这种配置下,CPU的工作相对轻量。但智能体AI的工作负载完全不同。它不再是单一查询,而是涉及规划、工具调用、记忆管理、调度和跨多个模型与数据源协调等多步工作流,而所有的这些编排任务,都运行在通用CPU上。
AMD内部分析预测,随着智能体AI的规模化,CPU与GPU的比例将从目前4–5:1的范围向接近1:1压缩 。苏姿丰甚至暗示,在某些极其密集的智能体部署场景下,该比例甚至可能出现反转,即一个节点中的CPU数量超过GPU
。
其市场影响意义深远。AMD已将其服务器CPU的总可寻址市场(TAM)预测从约600亿美金上调一倍,至2030年的1200亿美元,预计市场年增长率将从此前的18%提升到35%以上 。2026年,服务器CPU已经出现了短缺,其根源正是智能体AI基础设施建设的激增与企业更新周期挤在了一起,对有限的产能造成了挤压
。
投资者对这份CPU需求逻辑的反应极为迅速。在包含TAM上调至1200亿美元的2026年第一季度财报公布后,AMD股价飙升19%,创下约421美元的历史新高 。市场将此次TAM修正解读为一个持久的结构性转变信号,而非暂时性的需求激增。
更广泛的分析师群体对这一基本逻辑普遍持乐观态度。智能体AI每投入1美元的AI资本支出便能拉动更高CPU搭载率的论点,促使多家卖方机构上调了其盈利预期和目标价 。虽然具体由 Barclays 和 UBS 发布的研报未在现有信息源中出现,但整体市场反应无疑是积极的,CPU与GPU比例压缩被当作核心的催化剂。
Supermicro在Computex 2026上扮演的角色远超一个标准合作伙伴展示。作为率先将Helios推向市场的厂商之一,它利用Computex的展位展示了一套完整运行的72-GPU双宽Helios机架,该系统基于其“数据中心积木式解决方案”架构构建 。
这套系统结合了Instinct MI455X GPU、第六代EPYC Venice CPU和Pensando智能网卡及数据处理单元,并统一在AMD开放的ROCm软件栈之下 。其目标工作负载包括大规模AI训练、推理、主权AI(Sovereign AI)以及大模型微调,支持从单一机架到完整集群部署的模块化扩展
。
这场演示传递了一个明确的信号:Helios不是一个停留在纸面上的平台。它是一个真实、可部署的系统,拥有来自主要原始设备制造商的生态支持,并且已准备好从今年晚些时候开始,为超大规模及新云端(NeoCloud)AI基础设施合约展开竞争。
AMD典型的秋季活动“Advancing AI”,将是下一波重要信息发布的自然舞台。鉴于Venice已经投产且Helios部署计划于2026年下半年启动,业界最期待的公告包含:最终的Venice SKU规格与定价、MI450X和MI455X GPU更深层次的架构细节、Meta以外的Helios客户列表,以及已确认的2027年下一代EPYC “Verano” 处理器的预览 。
同时,更详细的智能体AI参考架构也极有可能出现,它将具体展示,当整个行业转向更密集的CPU-GPU配比时,AMD期望CPU服务器机架如何与GPU基础设施进行集成。
AMD在Computex 2026传递的核心信息异常清晰:这家公司相信,数据中心即将以一个任何预测都未曾捕捉到的速度,开始疯狂吞噬CPU。而Venice和Helios,正是为那个时刻而生的。
Comments
0 comments