配合 NemoClaw 嘅係 OpenShell,一個安全、隔離嘅執行環境,專門負責執行私隱管控,確保 Agent 喺任何專屬平台上都可以安全執行——無論係 RTX 工作站、雲端 VM,定係新出嘅 DGX Station 。呢兩樣嘢夾埋,就等於為呢班「數碼同事」提供咗一個沙盒環境,令佢哋可以長時間工作,又唔會搞到啲敏感資料。
要驅動呢班 Agent 嘅智慧,就要靠 Nemotron 3 Ultra。呢個係一個有 5500 億參數嘅開源模型,Nvidia 仲話係美國公司推出過入面最猛嘅開源模型 。佢係成個 Nemotron 3 家族嘅頂尖型號,位於早前推出嘅 40 億參數 Nano 同 1200 億參數 Super 模型對上
。
根據 Nvidia 嘅官方文件同白皮書,呢個模型採用嘅係混合式 Mamba-Transformer 混合專家架構 (Mixture-of-Experts, MoE) 。咁樣嘅設計令到每個 token 可以用到最多約 550 億個活躍參數,同時保持推理效率
。Nvidia 話比起以前嘅模型,佢喺處理複雜 Agent 工作流程嗰陣,推理速度快咗成 5 倍,成本最多降低咗 30%
。
好關鍵嘅一點係,Nemotron 3 Ultra 本身有個** 100 萬 token 嘅超長上下文視窗**。Nvidia 嘅開發者網誌解釋話,呢樣嘢對於處理超大 codebase、做深入嘅多文件研究,同埋維持長時間 Agent 記憶嚟講非常重要,唔會再因為要斬開文件嚟睇而搞到前文後理甩晒 。呢個模型會喺 2026 年 6 月 4 日正式開放
。
Nvidia 再用一部新硬件,將由晶片到軟件嘅成個棧「埋尾」:就係 DGX Station for Windows。佢話呢部係全世界最勁嘅桌邊級 AI 超級電腦,專為直接將最前沿嘅 AI 開發工作帶到企業辦公枱,而且仲係行原生 Windows 。
佢嘅核心係全新嘅 NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,透過高速嘅 NVLink-C2C 互連技術,將一粒 Blackwell Ultra GPU 同一粒 72 核心嘅 Grace CPU 結合埋一齊,形成一個統一、最高可以去到 748 GB 嘅超大記憶體池 。結果就係一部可以提供高達 20 petaflops FP4 AI 運算效能嘅系統,可以喺本地完整執行高達 1 萬億參數嘅前沿 AI 模型,又或者同步處理幾百個 AI Agent 嘅工作
。
呢個舉動直接就係想將企業嘅 AI 開發工作,由共用嘅雲端實例,轉移到專用兼且「長開長有」嘅本地硬件上面。Nvidia 宣布 DGX Station for Windows 將會喺 2026 年第四季,經 OEM 系統組裝商嘅生態圈推出市場 。
工程同 EDA 軟件方面嘅巨頭就係首批用家。Cadence、Dassault Systèmes、西門子 (Siemens) 同埋 Synopsys (新思科技) 都宣布會用 NemoClaw 框架嚟建立「自主 AI 工程師」。呢班數碼同事嘅工作,就係要執行複雜嘅模擬同驗證流程,Nvidia 話咁樣可以將以往要搞幾個禮拜嘅工程工作,壓縮到幾個鐘頭內完成 。
喺網絡保安同數據分析方面,CrowdStrike 同 Palantir 正在整合呢個 Agent 平台,利用 Nemotron 開源模型嚟長時間執行自主 Agent,目標係俾保安同營運團隊可以用極快速度分析數據 。
至於硬件同平台方面,Microsoft (微軟) 正在合作,目標係為個人同企業 Agent 提供一個可以同 Windows 應用程式無縫連接嘅原生 Windows 使用體驗 。而系統組裝商 Dell (戴爾)、HP (惠普) 同埋 ASUS (華碩) 都榜上有名,係 DGX Station 桌邊級超級電腦嘅 OEM 合作夥伴,確保呢部超級電腦可以經標準嘅企業 IT 採購渠道廣泛供應
。
總結嚟講,Nvidia 藉住今次 GTC 台北嘅發布,已經將自己定位成唔單止係 Agentic AI 紀元嘅「零件供應商」,更加係一個完整、開放兼且 ready for enterprise 嘅「架構師」——由模型權重,一路包到去放喺你辦公室地板上面嗰部工作站為止。
Comments
0 comments