NVIDIA 將 Vera 定位為「AI 代理人時代的 CPU」。與泛用型伺服器處理器不同,Vera 專為需要快速、連續決策的自主 AI 系統進行最佳化,例如強化學習、資料庫交易和即時資料處理等工作 。
這款晶片是 NVIDIA 首款完全客製化的資料中心 CPU 核心,代號「Olympus」。它採用 10 指令寬度的擷取與解碼前端,並內建神經分支預測器,其實就是「以 AI 加速 AI 工作負載」。它基於 Arm v9.2 指令集,並透過實體資源分割(而非傳統的同步多執行緒)技術,提供了 176 個執行緒
。
| 規格 | 詳細資訊 |
|---|---|
| 核心數 | 88 個客製化 Olympus 核心(相容於 Armv9.2) |
| 記憶體頻寬 | 透過 LPDDR5X 最高可達 1.2 TB/s |
| NVLink-C2C 互連 | 與 Rubin GPU 的傳輸頻寬達 1.8 TB/s |
| 生產狀態 | 自 2026 年 5 月起已全面量產 |
獨立測試的結果描繪出一幅更細膩但同樣令人驚豔的圖像。2026 年 5 月 26 日,知名基準測試網站 Phoronix 公布了首批第三方數據。在各式各樣的工作負載(包含程式碼編譯、Python、Java 和資料庫處理)的幾何平均數表現上,88 核心的 Vera 比 Intel 的旗艦處理器 Xeon 6980P 快了 1.55 倍,並領先 AMD 的 EPYC 9575F 約 10%。它同時也比 NVIDIA 自家的前代 Grace CPU 快上 1.6 倍,並在 STREAM TRIAD 記憶體頻寬測試中,維持住了 90% 的峰值頻寬 。
這是首款專為 Vera CPU 打造的伺服器。HPE 在 COMPUTEX 2026 上首次對外展示,將其定位在代理式 AI、強化學習,以及 AI 工廠規模的資料處理等應用場景 。這款伺服器將於 2026 年秋季以 NVIDIA AI 運算產品組合的一環正式推出
。
針對最高密度的部署需求,HPE 也提供了液冷式的 Cray Supercomputing GX240 運算刀鋒,每片刀鋒最多可容納 16 顆 Vera CPU,並可在單一機架內擴充至 640 顆 CPU 與 56,320 個核心 。
Redpanda 是 NYSE 這項合作案中的串流資料層。該平台與 Apache Kafka 的工作負載相容,而其創辦人暨執行長 Alex Gallego 表示,公司內部的測試顯示,與其他經他們測試過的系統相比,Vera 能提供「最高達 5.5 倍的更低延遲」。對於一家每日處理超過一兆則訊息的證交所來說,這種程度的延遲改善不只是學術上的數據,它直接影響了交易執行品質與系統的穩定性
。
NYSE 是探索採用 Vera 的金融客戶中最具代表性的一家,但整個早期採用者名單宛若 AI 與雲端運算領域的名人錄。
Vera 不是一個單獨的故事。它是 NVIDIA 更大規模的 Vera Rubin 平台中的 CPU 部分,這個平台將 Vera CPU 與新一代的 Rubin GPU 相互搭配,專為驅動 AI 工廠和超級電腦而設計 。機架規模的 Vera Rubin NVL144 系統,其 FP4 推論效能高達 3.6 exaflops,FP8 訓練效能則達 1.2 exaflops,效能大約是目前 GB300 NVL72 系統的 3.3 倍
。
對金融市場而言,其含義顯而易見:交易所和交易公司長期以來被鎖定在 x86 架構上。Vera 代表了一條通往基於 Arm 架構、AI 優化基礎設施的可靠路徑,它結合了極致的記憶體頻寬、大量核心密度,以及與即時串流平台的原生整合能力。NYSE 的這項探索雖然仍在早期階段,但它預示著資本市場的基礎設施,正與高效能運算(HPC)與 AI 趨同,且不僅僅是在軟體層面,而是深入到了最底層的晶片矽核心。
Comments
0 comments