それらエージェントの知能を支えるのが、Nemotron 3 Ultraだ。これは5500億パラメータを持つオープンソースモデルで、NVIDIAは米国企業がリリースした中で最も強力なオープンモデルであると主張している 。このモデルは、既に発表されている40億パラメータのNanoや1200億パラメータのSuperを含むNemotron 3ファミリーの頂点に位置する
。
NVIDIAの公式ドキュメントとホワイトペーパーによると、このモデルはハイブリッドMamba-Transformer MoE(Mixture-of-Experts)アーキテクチャを採用している 。この設計により、1トークンあたり最大約550億のアクティブパラメータを使用しつつ、推論時の計算効率を高く保つことが可能になった
。NVIDIAの報告では、これにより複雑なエージェントワークフローにおいて、従来比で最大5倍の推論速度と、最大30%のコスト削減を実現するという
。
企業にとって重要なのは、Nemotron 3 Ultraが100万トークンものネイティブなコンテキストウィンドウを備えている点だ。NVIDIAの開発者ブログによれば、これは膨大なコードベース、複数の文書にまたがる深い調査、そして長時間稼働するエージェントの記憶領域において、テキストを断片的に区切る(チャンキング)ことによる弊害なしに、一貫性のある推論を持続させるための鍵となる 。このモデルは2026年6月4日に公開される予定だ
。
NVIDIAは、シリコンレベルからソフトウェアに至るスタックを完成させるハードウェアとして、DGX Station for Windowsを発表した。「世界で最も強力なデスクサイドAIスーパーコンピュータ」と銘打たれたこのシステムは、最先端のAI開発をWindowsネイティブの環境で企業のデスクに直接もたらすために設計されている 。
新型のNVIDIA GB300 Grace Blackwell Ultra Desktop Superchipを搭載し、Blackwell Ultra GPUと72コアのGrace CPUを高速インターコネクトNVLink-C2Cで接続することで、最大748GBもの巨大な統合コヒーレントメモリプールを実現した 。その結果、最大20ペタフロップス(FP4) というAI計算能力を得て、1兆パラメータに達する最先端AIモデルを完全にローカルで実行したり、数百ものAIエージェントを同時並行で稼働させたりすることが可能になる
。
これは、企業のAI開発を共有クラウド環境から、常時稼働する専用のローカルハードウェアへとシフトさせるための、直接的な一手と言える。NVIDIAは、DGX Station for Windowsが2026年第4四半期に、OEMのシステムビルダーを通じて提供されることを発表した 。
エンジニアリングおよびEDA(電子設計自動化)ソフトウェアのリーダー企業がいち早く動いている。ケイデンス(Cadence)、ダッソー・システムズ(Dassault Systèmes)、シーメンス(Siemens)、シノプシス(Synopsys) は、NemoClawフレームワークを活用して自律型AIエンジニアを構築する計画を発表した。これらの「デジタル同僚」は、複雑なシミュレーションや検証ワークフローを実行するために設計されており、NVIDIAはこれにより数週間かかる作業が数時間に圧縮されるとしている 。
サイバーセキュリティとデータ分析の分野では、クラウドストライク(CrowdStrike) とパランティア(Palantir) が、このエージェントプラットフォームを統合し、Nemotronオープンモデルを活用した長時間稼働型の自律エージェントを動作させる。これにより、セキュリティチームや運用チームはデータを劇的に高速に分析できるようになる 。
ハードウェアとプラットフォームの側面では、マイクロソフト(Microsoft) が協業し、Windowsアプリケーションとシームレスに連携する、個人用および企業用エージェントのためのネイティブWindows体験を提供する 。また、システムビルダーであるデル(Dell)、HP、ASUSがDGX StationのOEMパートナーとして名を連ね、このスーパーコンピュータが標準的な企業IT調達チャネルを通じて広く入手可能になることを保証している
。
GTC Taipeiでのこれらの布石により、NVIDIAはエージェントAI時代の単なる部品サプライヤーではなく、モデルの重みからオフィスに置かれるワークステーションに至るまで、完全かつオープンでエンタープライズ対応のスタックを設計する「アーキテクト」としての地位を確立したのである。
Comments
0 comments