呢個系統最得意嘅地方係,佢哋冇特登開發一個新嘅協調系統,而係用返軟件工程師最熟嘅工具:Git。當一個Agent工作站有突破嘅時候,就會將改好嘅策略Code Commit上嚟;其他Agent就可以Pull落嚟嚟用,或者喺上面再發展。咁樣就實現咗分佈式、非同步嘅協作改進,唔使中央協調。
研究團隊部署咗8個AI編碼Agent,每個配一部機械人工作站,每部工作站有雙六軸機械臂、Intel RealSense深度鏡頭同本地NVIDIA RTX 5090 GPU。佢哋只係話俾Agent知「盡快完成任務、確保機械人安全、唔好浪費運算資源」,然後就放佢哋自己玩。
呢個系統係「Token大胃王」。Agent要睇文獻、寫Code、分析Log、不停Loop——每個改進循環都會消耗海量LLM Token。研究團隊俾咗Agent一個「慷慨嘅Token預算」,仲叫佢哋唔好浪費。
三個測試嘅Agent(Codex、Claude Code、Kimi Code)喺仿真入面全部都成功解決咗Push-T任務。但係唔係個個都可以順利轉移到真實硬件。ENPIRE冇消滅到仿真同現實之間嘅鴻溝,佢只係畀Agent透過重複實體測試去發現呢個差距,然後適應返。呢個係論文入面承認嘅一個核心限制
。
ENPIRE唔係獨立事件,佢係NVIDIA更大嘅Physical AI策略嘅一部份:
Comments
0 comments