傳統雲端 CPU 主要設計用嚟處理:
但 Nvidia 指出,AI 代理嘅工作模式完全唔同。
一個 AI agent 完成任務通常會經歷多個步驟,例如:
呢啲操作好多都發生喺神經網絡模型之外,但仍然要快速完成,先可以保持 GPU 持續運作。
公司聲稱喺目標場景下,Vera 可以做到:
Vera 並唔係用嚟取代 GPU,而係同 GPU 一齊運作。
喺 Nvidia 下一代 Vera Rubin 平台入面,多種晶片會整合成一個完整 AI 系統,包括:
例如 Vera Rubin NVL72 機架:
喺呢個架構入面:
CPU 主要負責:
Nvidia 嘅論點係:AI 應用模式正喺改變。
早期生成式 AI 通常只係:
但 AI agents 會做多步推理同操作,包括反覆查資料、執行工具同呼叫模型。
喺呢種架構入面,CPU 就變成 AI 基礎設施嘅控制平面(control plane):
如果未來有數十億個 AI agent 持續運行,CPU 層就可能成為 AI 基礎設施市場嘅重要部分。
Vera CPU 亦代表 Nvidia 正正式式進軍伺服器 CPU 市場。
長期以來:
主導數據中心 CPU。
而大型雲服務商,例如:
亦開始設計自家晶片。
Nvidia 嘅策略則唔係只賣單一晶片,而係打造 完整 AI 系統平台。
公司認為呢種整合式設計可以帶來:
當然,競爭仍然激烈。大型雲服務商有強烈動機開發自家晶片,以減少對 Nvidia 嘅依賴。
但 Nvidia 嘅賭注係:整個 AI 基礎設施生態(GPU + CPU + 網絡 + 軟件) 一旦形成,競爭對手要完全複製並唔容易。
Vera CPU 其實反映 Nvidia 一個更大嘅策略轉型。
公司正逐步由:
GPU 製造商 → AI 基礎設施平台供應商。
未來產品唔再只係晶片,而係完整嘅 AI 系統,包括:
如果黃仁勳對 AI 代理時代嘅判斷正確,CPU(例如 Vera)可能會成為 AI 基礎設施入面不可或缺嘅核心元件,亦令 Nvidia 嘅市場機會由 GPU 擴展到更龐大嘅 AI 生態。
Comments
0 comments