EN — 環境モジュール:物理シーンをランダム化された初期状態に自動リセットし、視覚ベースの報酬関数(セグメンテーションモデルやバウンディングボックス検出器など)を用いてタスク完了を検証する。試行のたびに人間がロボットをリセットする必要はない。
PI — 方策改善モジュール:ヒューリスティック学習、ツール呼び出し、行動クローニング、オフライン強化学習、オンライン強化学習など、複数の手法で方策の改良を開始する。コーディングエージェントがアルゴリズム上の仮説を提案し、コードを記述する。
E — 進化モジュール:コーディングエージェントがログを分析し、研究文献を参照し、ブランチを比較し、訓練インフラとアルゴリズムコードを修正して失敗モードに対処する。成功したレシピは再利用され、失敗した仮説は刈り込まれる。
特権的なオーケストレーション層を発明する代わりに、このフレームワークは分散コラボレーションのための慣れ親しんだツールを採用した。Gitである。いずれかのエージェントステーションがブレークスルーを達成すると、改善された方策コードをコミットする。他のステーションはその更新をプルして構築する。これにより、集中管理を必要としない分散型の非同期的改善が実現する。
研究チームは8台のAIコーディングエージェントを8台のロボットワークステーションとペアリングした。各ステーションは6自由度の双腕ロボットアーム2本、Intel RealSense深度カメラ、ローカルのNVIDIA RTX 5090 GPUを搭載する。GPUとトークン予算の割り当てを与えられたエージェントは、たった一つの目標のもとに解放される。「タスクをできるだけ早く解決し、ロボットを忙しく保ちつつ安全を確保し、貴重な計算資源を無駄にするな」。
なお、pass@8は1回の長時間ホライズンロールアウト内での創発的なリトライと復帰(過去の失敗を条件とした最大8回のコンテキスト内リトライ)を測定する指標であり、単純な8回独立試行の最良結果ではない。
エージェントに8台のロボットを与えると、1台の場合と比較して、ピン整理タスクでほぼ完璧なパフォーマンスに達するまでの時間が1.5時間以上から約40分に短縮された。しかし、この加速には代償が伴う。エージェント数が増えるに従い、総トークン消費は超線形に増加する。その理由は、各エージェントが自身の実験を行うだけでなく、他のエージェントの研究進捗を継続的に読み、理解する必要があるからだ。システムはより高い計算コストと引き換えに、より短い研究開発時間を手に入れている
。
テストされた3つの最先端コーディングエージェント(Codex(GPT-5.5)、Claude Code(Opus 4.7)、Kimi Code(Kimi K2.6))は、すべてシミュレーション上でPush-Tタスクを解決した。しかし、すべてが実機にクリーンに転送されたわけではない。ENPIREはシミュレーションから実機へのギャップを消し去るわけではない。ENPIREはAIエージェントに、反復的な物理試行を通じてそのギャップを発見し、適応する手段を与えるのである
。この点は論文でも中心的な限界として率直に認められている
。
ENPIREは、物理世界を理解し行動するAI(フィジカルAI)に関するNVIDIAのより広範な戦略の中に位置づけられる。
ENPIREは、このインフラ上に位置する研究自動化レイヤーである。シミュレーション(Cosmos/Isaac)と実機(ロボット艦隊、AIファクトリー)、そして最先端コーディングエージェントによる自律的な方策改善の間のループを閉じる役割を担う。研究チームのJim Fan氏は、ENPIREをオープンソース化する意向も示しており、テクノロジー愛好家が自宅で自律ロボット研究所を運用する未来も視野に入っている
。
NVIDIA Research, "ENPIRE: Agentic Robot Policy Self-Improvement in the Real World"
HotHardware, "NVIDIA AI Robots Learn To Install Graphics Cards Without Human..."
RoboHorizon, "NVIDIA ENPIRE: AI agents run robot research labs"
Hyper AI, "NVIDIA Pairs AI Agents With Robots To Autonomously Conduct..."
Softonic, "Nvidia unveils ENPIRE: self-training robots reach 99% success"
LINE TODAY Taiwan, "NVIDIA 把機器人實驗交給AI 代理"
Let's Data Science, "Nvidia showcases robots installing GPUs autonomously"
163.com, "英伟达机器人自学'装显卡'"
新浪财经, "NVIDIA团队让编程Agent接管真实机器人实验"
新浪财经, "英伟达机器人自学'装显卡':把 AI 带到现实世界直接放养"
Facebook / xixidu, "NVIDIA: Today, we enable AutoResearch in the physical world"
WindowsForum, "Nvidia Is Selling The..."
Hyundai Newsroom, "Hyundai Motor Group Partners with NVIDIA"
The Autonomy Report, "China Ships Hundreds of Factory Humanoids"
NVIDIA Investor Relations, "NVIDIA and Hyundai Motor Group Team on AI Factory"
NVIDIA Newsroom, "NVIDIA Omniverse Physical AI Operating System Expands"
163.com, "英伟达把8个AI和8台机器人关在一起"
Comments
0 comments