这些机构通常是全球最早部署新型 AI 计算架构的组织,因此也成为 Vera 平台的首批实验用户。
传统服务器 CPU 的目标是通用计算,但 Vera 的设计重点是 AI系统调度与数据协调。
现代 AI 系统不仅仅是运行神经网络,还需要执行大量 CPU 密集型任务,例如:
公开信息显示,Vera 是一款基于 Arm 架构 的数据中心 CPU,采用英伟达自研核心设计。
主要规格包括:
英伟达表示,Vera 针对“代理式 AI 工作负载”进行了优化,这类任务需要大量 CPU 与 GPU 的协同。
官方基准测试声称:
Vera CPU 并不是单独部署,而是作为 Vera Rubin AI平台 的 CPU 部分存在。
旗舰系统是 Vera Rubin NVL72 机架,其核心配置包括:
英伟达还介绍了另一种配置:
过去十多年,英伟达在 AI 基础设施中的核心优势是 GPU。但随着 AI 系统规模不断扩大,仅靠 GPU 已无法满足需求。
大型 AI 集群需要完整技术栈:
通过推出 Vera,英伟达正在从 GPU供应商转型为完整AI基础设施提供商。
这意味着在 AI 数据中心中,英伟达可以提供从 CPU 到 GPU、网络到软件的 全栈解决方案,减少对外部 CPU 供应商的依赖。
这一举动也使英伟达更直接进入服务器 CPU 市场。
目前该市场仍主要由 Intel Xeon 和 AMD EPYC 主导。不过竞争格局正在变化:
在 AI 数据中心中,如果 CPU 与 GPU 深度绑定,英伟达就有机会在服务器硬件价值链中占据更大的份额。
Vera CPU 的发布也反映出 AI 计算的一种行业趋势:
数据中心架构正从“组件拼装”转向“整体平台设计”。
英伟达正在把:
打包为统一的 AI Factory(AI工厂)基础设施。
如果 Vera 能实现其宣称的性能提升,那么未来 AI 数据中心的设计方式可能会发生变化——CPU、GPU、网络和软件将被共同设计,而不是分别采购再集成。
Comments
0 comments