这款芯片是NVIDIA首个完全自研的数据中心CPU核心,代号“Olympus”。它采用10-wide指令预取和解码前端,并搭载了神经分支预测器,本质上是用AI来加速AI工作负载 。它基于ARM v9.2指令集,通过物理资源分区而非传统的同步多线程技术,暴露了176个线程
。
| 规格 | 详情 |
|---|---|
| 核心 | 88个定制Olympus核心(兼容ARMv9.2) |
| 内存带宽 | 最高1.2 TB/s(通过LPDDR5X) |
| NVLink-C2C互联 | 与Rubin GPU之间带宽达1.8 TB/s |
| 生产状态 | 自2026年5月起已全面投产 |
独立测试的结果更为审慎,但同样令人印象深刻。2026年5月26日,基准测试网站Phoronix发布了首个第三方测试数据。在代码编译、Python、Java和数据库处理等多种工作负载的几何平均值测试中,88核的Vera性能比英特尔的旗舰Xeon 6980P快了1.55倍,并领先AMD的EPYC 9575F约10%。其性能也超越了NVIDIA自家的前代Grace CPU 1.6倍,并在STREAM TRIAD基准测试中维持了**90%**的峰值内存带宽 。
这是首款为NVIDIA Vera CPU专门构建的服务器。HPE在2026年COMPUTEX上发布了它,将其定位为面向代理式AI、强化学习和AI工厂规模的数据处理 。它将于2026年秋季作为NVIDIA AI Computing产品组合的一部分上市
。
对于最高密度的部署,HPE还提供了一款液冷的Cray Supercomputing GX240计算刀片,每个刀片最多可容纳16个Vera CPU,并可在一个机架内扩展至640个CPU和56,320个核心 。
Redpanda是此次纽交所协作项目中的流数据层。该平台兼容Apache Kafka工作负载,其创始人兼CEO亚历克斯·加列戈(Alex Gallego)表示,公司内部测试显示,与它们基准测试过的其他系统相比,Vera的延迟降低了最高5.5倍 。对于日处理超万亿条消息的交易所来说,这种程度的延迟降低绝非纸上谈兵,而是直接关乎交易执行质量和系统韧性
。
纽交所是Vera在金融领域最高调的应用探索者,但早期采用者名单读起来就像是AI和云计算领域的“名人录”。
Vera并非一个孤立的故事。它是NVIDIA更大的Vera Rubin平台的CPU部分——与下一代Rubin GPU配对——旨在为AI工厂和超级计算机提供动力 。机架级的Vera Rubin NVL144系统额定达到了3.6 exaflops的FP4推理性能和1.2 exaflops的FP8训练性能,大约是当前GB300 NVL72系统性能的3.3倍
。
对于金融市场而言,其含义再清晰不过:数十年来,交易所和交易公司一直被锁定在x86架构上。而Vera代表了一条通向基于ARM、AI优化的基础设施的可行路径,它结合了强大的内存带宽、巨大的核心密度以及与实时流平台的原生集成。纽交所的探索虽然尚在早期,却标志着一个转折点——资本市场的基础设施正在与高性能计算(HPC)和人工智能融合,而且不仅仅是在软件层面的融合,更是深入到了芯片底层。
Comments
0 comments