如果用一句講晒:Siemens 幫 Arm 做嘅,是將 Arm AGI CPU 放入硬件輔助仿真同 FPGA 原型環境入面,喺正式流片、即係交去製造前,先大規模測試佢嘅硬件同軟件行為。[5]
對晶片設計團隊嚟講,流片前最重要係盡早搵出風險。AGI CPU 呢類面向資料中心同 agentic AI 工作負載嘅處理器,唔係單靠跑幾個 RTL 模擬就夠;佢要驗證核心、互連、I/O、功耗、延遲,仲要確保軟件堆疊可以及早準備好。
Siemens 用咩工具幫 Arm?
Siemens 嘅核心角色有兩部分:
- Veloce Strato CS:一個硬件輔助驗證/仿真平台,用嚟支援 Arm AGI CPU 由子系統到全系統層面嘅驗證。[
5]
- Veloce proFPGA CS:一個 FPGA 原型平台,讓團隊可以喺實體晶片未出現之前,先用接近即時速度嘅原型去做軟件開發、驅動驗證同系統 bring-up。[
5]
換句話講,Siemens 提供嘅唔係單一測試工具,而係一套「流片前預演」基建:先用仿真平台確認晶片設計喺大系統入面點運作,再用 FPGA 原型俾軟件團隊提早落手。
點解 Arm AGI CPU 需要咁大規模驗證?
Arm AGI CPU 建基於 Arm Neoverse CSS V3 平台,目標係為 agentic AI 同雲端資料中心部署提供高效能、能源效率較高嘅運算能力。[5] 另外,Arm 亦將 AGI CPU 定位為其首款自家設計嘅資料中心 CPU,面向 agentic AI 基建。[
1]
所謂 agentic AI,可以理解為一類會拆解任務、調用工具、連續執行步驟嘅 AI 工作負載。喺資料中心層面,呢類工作負載會對 CPU、加速器、記憶體、儲存同網絡之間嘅協調提出更高要求。因此,晶片唔只要「核心快」,仲要喺整個機架、整個系統層面穩定達到效能、延遲同功耗目標。
Siemens 表示,Arm 用 Veloce Strato CS 支援 AGI CPU 從 subsystem 到 full-system level 嘅驗證,目的正正係喺 tapeout 前處理超大規模部署所需嘅效能、延遲同功耗要求。[5]
「多座 Veloce Strato CS」代表咩?
今次驗證唔係細規模試跑。Arm 的 Karima Dridi 表示,Siemens 透過多座 Veloce Strato CS,讓 Arm 可以大規模進行 Arm AGI CPU 全系統驗證。[5]
呢個規模之所以重要,係因為設計本身相當複雜:Siemens 提到,Arm AGI CPU 涉及多晶粒(multi-die)CSS 架構、Neoverse V 系列核心、高速互連,以及 PCIe Gen6、NVMe、CXL 等資料中心常見高速連接技術。[5] Siemens 的說法係,單靠傳統 EDA 工具,難以用足夠規模同逼真度驗證整個系統。[
5]
簡單講,傳統軟件模擬可以好精細,但速度同規模有限;硬件輔助仿真則可以將更大、更接近實際系統嘅設計跑起,幫工程團隊喺晶片未生產前觀察系統行為。
FPGA 原型點樣幫到軟件團隊?
另一個重點係 Veloce proFPGA CS。Siemens 表示,呢個 FPGA 原型平台用於 pre-silicon software development,能夠以接近即時速度運行原型,令團隊可以喺實體矽片到手前數個月,已經開始軟件驗證、驅動開發同系統 bring-up。[5]
呢點對資料中心 CPU 尤其重要。因為一粒 CPU 能否成功落地,唔只睇硬件設計,仲要睇作業系統、韌體、驅動、I/O 裝置同整體平台軟件能否配合。越早俾軟件團隊接觸近似真機嘅環境,就越有機會喺正式晶片回來前清走問題。
總結:Siemens 幫 Arm 減低 tapeout 前風險
所以,Siemens 幫 Arm 驗證 AGI CPU 嘅方法,可以分成三層:
- 硬件仿真:用 Veloce Strato CS 跑大規模設計,做 subsystem 到 full-system 驗證。[
5]
- 效能與系統指標驗證:檢查 Neoverse V 系列 Compute Subsystem 相關關鍵效能指標,以及資料中心部署關心嘅效能、功耗同延遲目標。[
5]
- 軟件原型開發:用 Veloce proFPGA CS 俾團隊喺未有實體晶片前,提早做軟件、驅動同系統 bring-up。[
5]
一句到尾:Siemens 提供嘅係 Arm AGI CPU 流片前嘅「大型試車場」。透過仿真、全晶片驗證同 FPGA 原型,Arm 可以喺真正矽片出現之前,先盡量確認硬件設計同軟件生態是否準備好,從而降低面向超大規模 AI 資料中心部署時嘅技術風險。[5]






