呢啲規格係專門為咗「自主AI代理」而設計。一個100萬token嘅上下文窗口同原生多token預測,唔係為咗畀你閒聊用;佢哋係為咗一個需要維持複雜工作流程嘅內部記憶、推理代碼、監控數據管道,同埋長時間規劃多步驟行動嘅模型而設。NVIDIA將Ultra呢個變體,定位為一個「用於需要深度研究同戰略規劃嘅複雜AI應用嘅大型推理引擎」 。呢個模型嘅開源權重,計劃喺2026年6月4日於Hugging Face、OpenRouter等平台公開發布
。
Palantir唔係就咁插個Chatbot落佢個系統度。佢係將Nemotron模型整合到佢個**AI FDE(Forward Deployed Engineer,前線部署工程師)**平台,一個喺Palantir Foundry入面運作嘅互動式代理 。AI FDE設計嚟係要將自然語言指令,翻譯成具體嘅營運行動:例如執行數據轉換、管理代碼庫,同埋建立同維護一個組織嘅核心本體論
。
呢次整合嘅目標,係要令呢啲代理變到「長期運作」,呢個詞係NVIDIA同Palantir用嚟區分呢一波新技術同單次查詢嘅大語言模型嘅關鍵 。喺呢個情境下,一個可以長期運作嘅代理,可以自主執行一個複雜嘅多步驟任務——例如接入一個新嘅數據流、轉換佢、更新本體論,然後喺上面建立一個新嘅營運應用程式——全程唔使人類喺每個步驟都拖住手仔教路
。呢個代理嘅設計,係要從呢啲互動中持續學習,從而構建出針對特定領域、可以喺完全斷網(Air-gapped)環境下運作嘅企業系統,而且仲會隨住時間變得愈嚟愈專業
。
呢種能力,係植根於Palantir最核心嘅差異化優勢:佢嘅Ontology(本體論)。Ontology係一個數碼表徵,將一個組織所有嘅數據、邏輯同行動都映射出嚟,令到AI代理唔單止明白數據,仲可以明白間公司實際上係點樣運作嘅。通過將NVIDIA嘅Nemotron模型同呢個語義地圖融合,兩間公司正在構建一個為實時營運決策而設嘅技術堆疊,令AI可以明白一個行動喺供應鏈、軍事後勤網絡或者網絡安全防禦姿態入面,會產生乜嘢連鎖反應。
呢項技術並唔係空口講白話。佢嘅目標係全球一啲最複雜、最關鍵任務嘅環境。Palantir嘅客戶基礎橫跨兩大界別:
終極嘅願景,就好似喺Palantir嘅DevCon大會上面展示咁,係一個可以喺安全環境入面管理成個工程生命週期嘅AI代理——由編寫函數、創作評估,到喺一個有分支感知嘅迴圈入面安全地調試代碼——而且呢一切,都係喺一啲經常同公共互聯網完全隔絕嘅系統入面進行 。
星期一嘅宣布係一個關鍵嘅產品里程碑,而唔係呢段關係嘅起點。呢次整合嘅戰略框架,早喺2025年10月嘅華盛頓GTC大會上就已經奠定,當時NVIDIA同Palantir首次宣布,佢哋正在構建一個「業界首創嘅整合式技術堆疊,用於營運AI」 。嗰份初步協議,承諾將NVIDIA嘅Blackwell架構、CUDA-X庫同Nemotron模型,同Palantir嘅Ontology平台結合
。
同Palantir嘅消息一齊,NVIDIA喺6月1日嘅台北GTC大會,亦都係佢企業代理策略嘅一個更廣泛嘅啟動平台。公司介紹咗NVIDIA Agent Toolkit,一個捆綁咗NemoClaw藍圖、Nemotron模型、OpenShell安全執行時環境同CUDA-X庫嘅平台,用嚟幫助企業部署自主AI代理。Palantir同SAP被指定為呢次發布嘅主要合作夥伴 。網絡安全巨頭CrowdStrike亦都宣布咗一個並行嘅整合,使用Nemotron模型嚟驅動新嘅漏洞識別代理,確認咗「長期運作代理」呢個範式係成個生態系統嘅推動方向,而唔係單一嘅合作計劃
。
Palantir同NVIDIA嘅整合,標誌住企業AI由實驗性嘅副駕駛(Copilot),邁向嵌入式、自主操作者嘅成熟階段。通過將一個針對長遠推理而優化嘅頂尖開放模型,同一個本身就代表住組織點運作嘅平台配對,兩間公司押注嘅係,AI代理嘅天然棲息地並唔係一個聊天窗口——而係企業本身嘅營運心臟地帶。Nemotron 3 Ultra嘅開源特性,亦都為咗對安全極度關注嘅政府同企業客戶,提供咗一條喺私人、完全斷網嘅基礎設施上,部署尖端推理能力嘅路徑,而唔需要將數據發送畀第三方API,呢一點係Palantir核心市場一個無得傾嘅硬性要求 。
Comments
0 comments