这些规格是专为“代理式 AI”量身定做的。100 万词元的上下文窗口和原生的多词元预测,并非为闲聊设计,而是为了让模型能够长期维持对复杂工作流程的内部记忆,对代码进行推理,监控数据管道,并规划多步骤的长期行动。 英伟达将 Ultra 版本特别定位为用于需要深度研究和战略规划的复杂 AI 应用的“大型推理引擎”。
该模型的开源权重计划于 2026 年 6 月 4 日通过 Hugging Face、OpenRouter 等平台公开发布。
Palantir 并非简单地将一个聊天机器人连接到其系统中。它是在将 Nemotron 系列模型集成到其 AI FDE(AI 前线部署工程师) 平台,一个在 Palantir Foundry 系统内运行的交互式代理。 AI FDE 的设计初衷是将自然语言指令转化为具体的业务操作:执行数据转换、管理代码仓库,以及构建和维护组织的中央本体(Ontology)。
此次集成的目标是让这些代理变得“长时运行”,这是英伟达和 Palantir 用来区分这一新浪潮与传统单轮大语言模型查询的术语。 在这个语境下,一个“长时运行”的代理能自主执行复杂、多步骤的任务——比如接收新的数据流、进行转换、更新本体,并在此基础上构建一个新的业务应用程序——而无需人在每一步都进行干预。
该代理旨在从这些交互中持续学习,从而构建出能够随时间推移不断加深其专业性的特定领域、物理隔离的企业系统。
这一能力的根基在于 Palantir 的核心差异化优势:它的 Ontology(本体)。本体是一个数字映射,它描绘了组织内所有的数据、逻辑和行动,使得 AI 代理不仅理解数据,更能理解业务的实际运作方式。 通过将英伟达的 Nemotron 模型与这张“语义地图”融合,两家公司正在构建一个专为实时运营决策而设计的堆栈。在这套系统里,AI 能理解一个行动在整个供应链、军事物流网络或网络安全态势中产生的连锁反应。
这项技术并非纸上谈兵。它的目标是全球最复杂、最关键的运行环境。Palantir 的客户群横跨两个广泛而深度交织的领域:
在 Palantir 的 DevCon 大会上展示的最终愿景是:一个能在安全环境内管理整个工程生命周期的 AI 代理——从编写函数、创建评估到在分支感知循环中安全地调试代码——这一切都运行在完全与公共互联网断开的系统内。
周一的公告是一个关键的产品里程碑,而非这段关系的起点。这一集成的战略框架早在 2025 年 10 月的英伟达 GTC 华盛顿大会上已经奠定。当时,英伟达和 Palantir 首次宣布,他们正在构建“一个史无前例的运营 AI 集成技术堆栈”。 那份初步协议承诺将英伟达的 Blackwell 架构、CUDA-X 库和 Nemotron 模型与 Palantir 的本体平台相结合。
与 Palantir 的消息同时,6 月 1 日的英伟达 GTC 台北大会也扮演了其企业代理战略的启动台角色。该公司推出了 NVIDIA Agent Toolkit,这是一个捆绑了 NemoClaw 蓝图、Nemotron 模型、OpenShell 安全运行时和 CUDA-X 库的平台,旨在帮助企业部署自主 AI 代理。Palantir 和 SAP 被指定为主要启动合作伙伴。 网络安全巨头 CrowdStrike 也宣布了一项并行的集成计划,将使用 Nemotron 模型驱动新的漏洞识别代理,这证实了“长时运行代理”范式是一次生态系统的整体推进,而非一次性的合作关系。
Palantir 与英伟达的集成,标志着企业 AI 正从实验性的副驾驶角色,走向嵌入式、自主化的运营者角色。通过将最先进的、为长周期推理优化的开源模型,与一个已经能够代表组织运行方式的平台配对,两家公司正在押注:AI 代理的天然栖息地并非聊天窗口,而是企业自身的运营核心。此外,Nemotron 3 Ultra 的开源性质,为对安全性高度敏感的政府和企业客户提供了一条可行路径,使其能够在私有、物理隔离的基础设施上部署前沿推理能力,而无需将数据发送给第三方 API——这对于 Palantir 核心市场来说,是不容妥协的硬性要求。
Comments
0 comments