Seine zentrale Ansage war direkt und einprägsam: „Nutzt keine Frontier-Modelle für Nicht-Frontier-Probleme.“ Er forderte seine Mitarbeiter dazu auf, ihre KI-Nutzung maßzuschneidern. Als praktisches Beispiel nannte er den Automatikmodus von Copilot, der als eingebautes Werkzeug die Aufgabe intelligent dem passenden, günstigeren Modell zuweist.
Das war keine beiläufige Interview-Bemerkung. Es war ein CEO, der ein kulturelles und finanzielles Problem innerhalb der eigenen Firma direkt ansprach und damit das Ende der „KI-Verspieltheitsphase“ einläutete.
Nadellas öffentliche Schelte ist nur die Spitze eines viel größeren Eisbergs. Die Wirtschaftlichkeit von KI hat sich dramatisch verändert, und die alte Gewohnheit, für jede Anfrage standardmäßig das stärkste Modell zu nutzen, ist heute eine direkte Bedrohung für die Gewinnmargen. Agentische KI, die für die Erledigung einer Aufgabe mehrere Modellaufrufe aneinanderreiht, kann im Vergleich zu einer Standardabfrage bis zu 1.000-mal mehr Tokens verbrauchen .
Ein konkretes Beispiel für diese Kostenexplosion lieferte Peter Steinberger, der Erfinder von OpenClaw. Er gab an, dass sein Team beim Betrieb von KI-Agenten mehr als 1,3 Millionen US-Dollar an Tokens ausgegeben hat . Selbst Microsoft spürte intern den Kostendruck: Das Unternehmen begann Berichten zufolge damit, die meisten direkten Claude-Code-Lizenzen zu kündigen und seine Entwickler auf GitHub Copilot CLI zu lenken – nicht nur aus Anbieterpräferenz, sondern weil die Kosten für die Nutzung teurer Drittanbieter-Modelle für Routine-Coding außer Kontrolle gerieten
.
Nadella selbst brachte es auf eine einfache Wahrheit: Frontier-KI muss als knappe, teure Industrieressource behandelt werden und nicht als kostenloses Allgemeingut .
Nadellas Warnung bei „Hard Fork“ steht in direktem Zusammenhang mit einem tiefgreifenden Umbau von Microsofts Kerngeschäftsmodell. Das Unternehmen bewegt sich weg von einer Welt, in der es einfach eine Pauschalgebühr pro Nutzer verlangen konnte, hin zu einer Welt, in der der unvorhersehbare, sprunghafte Verbrauch von KI-Agenten die Rechnung bestimmt.
1. Modell-Task-Matching als Kernkompetenz
Der Effizienzvorstoß geht über eine reine Kostensenkungsnotiz hinaus. Auf der Microsoft Build 2026 entwarf Nadella eine Vision, in der jedes Unternehmen eine eigene „Frontier-Intelligenz" aufbauen muss – eine Kombination aus Modellen, Daten und privaten Evaluationen –, anstatt blind von einem einzigen, teuren Large Language Model abhängig zu sein . Seine Anweisung, keine Spitzenmodelle für einfache Probleme zu nutzen, ist ein geschäftliches Grundprinzip und keine einfache IT-Bitte.
2. KI-Agenten, die wie Angestellte verwaltet werden
Nadella hat konsequent die Argumentation aufgebaut, KI-Agenten als „digitale Angestellte" zu behandeln. Das geht über Philosophie hinaus und betrifft die Lizenzierung. Microsoft plant Berichten zufolge neue Microsoft 365 Enterprise-Tarife, die pro Agent anstatt pro menschlichem Nutzer abrechnen. Dafür erhalten die KI-Agenten eine eigene Identität, E-Mail-Adresse und Zugriffsrichtlinien – genau wie jeder andere Mitarbeiter . Wie Nadella es formulierte: Das Geschäft wandelt sich von einem „Endbenutzer-Tool-Geschäft" zu einem „Infrastruktur-Geschäft zur Unterstützung von Agenten bei der Arbeit"
.
3. Der Übergang zur Hybridpreisgestaltung
Die Zukunft von Microsofts Umsatz hängt von einem neuen Preismodell ab, das Nadella während der Bilanzpressekonferenz für das dritte Quartal 2026 skizzierte: ein Wechsel vom „traditionellen Pro-Nutzer-Modell zum aufkommenden Nutzer-plus-Verbrauchsmodell" . Nahezu 60 Prozent der Kundenservice-Kunden nutzen bereits verbrauchsbasierte Guthaben, und das Unternehmen stellte GitHub Copilot mit Wirkung zum 1. Juni 2026 auf eine verbrauchsabhängige Preisgestaltung um
. Das alte Pro-Nutzer-SaaS-Modell kann schlicht nicht überleben, wenn ein einziger agentischer Arbeitsablauf mehr Rechenleistung verbrauchen kann als Tausende von Standard-Interaktionen; Microsoft kombiniert nun eine planbare Basislizenz mit Verbrauchsgebühren für rechenintensive Aufgaben
.
4. Eine Branche, die zur Effizienz gezwungen wird
Nadellas Kommentar spiegelt eine strukturelle Realität in der gesamten KI-Landschaft wider. OpenAI, Anthropic und GitHub rechnen alle nach Token-Verbrauch ab, was Effizienz grundsätzlich belohnt und Verschwendung bestraft . Eine Goldman-Sachs-Prognose geht davon aus, dass agentische Arbeitslasten den Token-Verbrauch bis 2030 um das 24-fache steigern könnten, auf erstaunliche 120 Billiarden Tokens pro Monat
. In diesem Umfeld werden die Unternehmen den Kostenstruktur-Kampf gewinnen, die die Disziplin beherrschen, eine einfache E-Mail-Zusammenfassung an ein günstiges, kleines Modell weiterzuleiten – und die Spitzen-Modelle für echte, komplexe Probleme zu reservieren. Diejenigen, die das nicht tun, werden in ihren eigenen Cloud-Rechnungen ertrinken
.
Nadellas Geständnis („Ich bin auch ein Tokenmaxxer") war nicht nur ein charmanter Moment der Ehrlichkeit. Es war eine sorgfältig platzierte kulturelle und strategische Direktive, die signalisiert, dass Microsofts KI-Ära ihr sorgenfreies, experimentelles Stadium verlassen hat und in eine Phase eingetreten ist, in der Kostendisziplin, intelligente Modellsteuerung und agentenbasierte Lizenzierung über Gewinner und Verlierer in der Unternehmens-IT entscheiden werden.
Comments
0 comments