Ergänzt wird die Orchestrierungsschicht durch OpenShell, eine abgeschottete, sichere Laufzeitumgebung. Sie setzt Datenschutzkontrollen für das Hosten und Ausführen von Agenten auf jeder dedizierten Plattform durch – egal ob auf einer RTX-Workstation, einer Cloud-VM oder der neuen DGX Station. Zusammen schaffen NemoClaw und OpenShell eine Art Sandkasten-Betriebsumgebung für digitale Kollegen, die unbegrenzt laufen können, ohne sensible Daten zu gefährden.
Die Intelligenz dieser Agenten wird von Nemotron 3 Ultra befeuert, einem offenen Modell mit 550 Milliarden Parametern, das laut Nvidia das leistungsfähigste offene Modell eines US-Unternehmens ist. Es steht an der Spitze der Nemotron-3-Familie, über den bereits veröffentlichten Modellen Nano (4 Milliarden Parameter) und Super (120 Milliarden Parameter).
Laut offizieller Nvidia-Dokumentation und dem begleitenden Whitepaper nutzt das Modell eine hybride Mamba-Transformer-Mixture-of-Experts (MoE)-Architektur. Dieses Design ermöglicht bis zu etwa 55 Milliarden aktive Parameter pro verarbeitetem Token (Wort oder Wortteil), während die Inferenz recheneffizient bleibt.
Nvidia berichtet von einer fünffach schnelleren Inferenz und bis zu 30 Prozent niedrigeren Kosten für komplexe, agentenbasierte Arbeitsabläufe im Vergleich zu Vorgängermodellen.
Entscheidend ist das native Kontextfenster von einer Million Token. Dieses riesige „Gedächtnis“ ist laut Nvidias Entwickler-Blog der Schlüssel für anhaltendes logisches Denken über riesige Codebasen, tiefgehende Recherchen in zahlreichen Dokumenten und ein dauerhaftes Agenten-Gedächtnis – ohne die typische Fragmentierung durch das Zerstückeln von Informationen. Die offene Veröffentlichung des Modells ist für den 4. Juni 2026 geplant.
Nvidia rundete den Stack vom Silizium bis zur Software mit der Enthüllung der DGX Station für Windows ab. Sie wird als der leistungsstärkste KI-Supercomputer der Welt für den Arbeitsplatz angepriesen und ist dafür konzipiert, modernste KI-Entwicklung direkt auf die Schreibtische von Unternehmen zu bringen – mit nativem Windows-Betrieb.
Angetrieben vom neuen NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, kombiniert die DGX Station eine Blackwell Ultra GPU mit einer 72-Kern-Grace-CPU über einen schnellen NVLink-C2C-Verbindungspfad. So entsteht ein vereinheitlichter und kohärenter Speicherpool von bis zu 748 GB. Das Ergebnis ist ein System, das bis zu 20 Petaflops an FP4-KI-Rechenleistung liefert und KI-Modelle mit bis zu einer Billion Parametern vollständig lokal ausführen oder Hunderte von parallelen KI-Agenten gleichzeitig unterstützen kann.
Dieser Schritt zielt direkt darauf ab, die KI-Entwicklung in Unternehmen von gemeinsam genutzten Cloud-Instanzen auf dedizierte, ständig verfügbare lokale Hardware zu verlagern. Nvidia kündigte an, dass die DGX Station für Windows im vierten Quartal 2026 über ein Ökosystem von OEM-Systemherstellern verfügbar sein wird.
Nvidia beließ es nicht bei Produktankündigungen, sondern präsentierte eine Koalition von Unternehmenspartnern, die bereit sind, den Stack in ihre Kernprodukte zu integrieren.
Marktführende Anbieter von Engineering- und EDA-Software sind unter den ersten Anwendern. Cadence, Dassault Systèmes, Siemens und Synopsys kündigten Pläne an, das NemoClaw-Framework für den Bau autonomer KI-Ingenieure zu nutzen. Diese digitalen Kollegen sollen komplexe Simulations- und Verifikations-Workflows ausführen – eine Aufgabe, die laut Nvidia wochenlange Ingenieursarbeit auf Stunden verkürzen kann.
Im Bereich Cybersicherheit und Datenanalyse integrieren CrowdStrike und Palantir die Agentenplattform, um langlebige autonome Agenten auf Basis der offenen Nemotron-Modelle laufen zu lassen. Ziel ist es, Sicherheits- und Betriebsteams eine drastisch schnellere Datenanalyse zu ermöglichen.
Auf der Hardware- und Plattformseite arbeitet Microsoft daran, eine native Windows-Erfahrung für persönliche und Unternehmens-Agenten zu schaffen, die sich nahtlos mit Windows-Anwendungen verbinden. Die Systemhersteller Dell, HP und ASUS werden als OEM-Partner für das DGX-Station-Desktopformat genannt, um sicherzustellen, dass der Supercomputer über die üblichen IT-Beschaffungskanäle von Unternehmen breit verfügbar sein wird.
Mit diesen Schritten positioniert sich Nvidia auf der GTC Taipei nicht nur als Komponentenlieferant für die Ära der agentenbasierten KI, sondern als Architekt eines vollständigen, offenen und unternehmenstauglichen Stacks – von den Modellgewichten bis zur Workstation im Büro.
Comments
0 comments