Das Tempo der Budget-Explosion war atemberaubend. Uber führte Claude Code Ende 2025 ein und förderte die Nutzung aktiv durch interne Bestenlisten, die Entwickler nach ihrem Token-Verbrauch rankten . Bis Februar 2026 hatte sich die Nutzung von Claude Code nahezu verdoppelt. Im März galten bereits 84 Prozent der Uber-Entwickler als Nutzer agentenbasierter Programmierung, und 65 bis 72 Prozent des in integrierten Entwicklungsumgebungen (IDE) geschriebenen Codes waren KI-generiert
. Ubers interner KI-Coding-Agent produziert inzwischen wöchentlich rund 1.800 Code-Änderungen
. Das Unternehmen hat die maximale Token-Nutzung regelrecht spielerisch gefördert – und genau das bekommen, wozu es angereizt hat.
Der Grund für die Kostenexplosion war nicht nur übertriebener Enthusiasmus. Uber hatte sein Budget um ein Pro-Benutzer-SaaS-Modell herum aufgebaut – ein Denkmodell, das zwei Jahrzehnte lang für berechenbare Softwarelizenzen funktioniert hat . Die Preisgestaltung bei generativer KI folgt jedoch einem fundamental anderen Prinzip: Jeder verarbeitete Token kostet Geld, und die Rechnung skaliert mit der Nutzungsintensität, nicht mit der Anzahl der zugangsberechtigten Benutzer. Das Marktforschungsunternehmen Gartner berichtet, dass agentenbasierte Workflows pro Aufgabe 5- bis 30-mal mehr Tokens verbrauchen als einfache Chatbot-Interaktionen – eine Kostenkurve, die mit traditionellen Prognosemethoden nicht abbildbar ist
.
Uber hat seine Ausgaben gemessen, aber nicht den Ertrag. Wie viel Zeit wurde pro Entwickler eingespart? Wie viele Softwarefehler wurden vermieden? Welche Auswirkungen gab es auf den Umsatz oder die Erfahrung der Fahrgäste? Auf diese Fragen hatte das Unternehmen keine klaren Antworten .
In einem Interview mit Business Insider im Mai 2026 machte Ubers Chief Operating Officer (COO) Andrew Macdonald das Spannungsfeld unmissverständlich deutlich. Nach Gesprächen mit leitenden Entwicklern sagte Macdonald, es werde „immer schwieriger zu rechtfertigen“, wie viel Geld das Unternehmen für KI-„Tokenmaxxing“ ausgebe . Er räumte ein, dass ein höherer Token-Verbrauch sich nicht in einer proportionalen Zunahme nützlicher Verbraucherfunktionen niederschlage: „Diese Verbindung ist noch nicht da, nicht wahr? Ich denke, vielleicht wird implizit mehr ausgeliefert, aber es ist sehr schwer, eine direkte Linie zwischen einer dieser Statistiken und der Aussage ‚Okay, das Geschäft bewegt sich jetzt schneller‘ zu ziehen“
.
Der CTO selbst hatte bereits eingeräumt, man stehe bei der Kostensteuerung von KI wieder „am Reißbrett“ . Die interne Dynamik offenbart ein klassisches Fehlanreiz-Problem: Die Führungsetage trieb die Nutzung der Werkzeuge aggressiv voran – mit Bestenlisten, öffentlichen Rankings und der Ermutigung durch den CTO – und musste dann feststellen, dass ungebremster Token-Konsum außer Kontrolle geratene Kosten ohne natürliche Bremse verursacht
. Die Entwickler nutzten die Tools rationalerweise so viel, wie es ihnen belohnt wurde. Das Unternehmen stellt nun rationalerweise infrage, ob dieser Konsum irgendeinen messbaren Effekt auf Margen, Kundenerfahrung oder Umsatz hat.
Uber ist kein Einzelfall. Auch Microsoft hat ähnliche Erkenntnisse gewonnen, dass KI-gestützte Programmierassistenten teurer sein können als die menschliche Arbeitskraft, die sie eigentlich ergänzen oder ersetzen sollen . Die strukturelle Herausforderung ist in der gesamten Unternehmenswelt dieselbe: Tools für generative KI werden pro Token abgerechnet, ihr Wert ist schwer zu isolieren und zu messen, und die Anreizsysteme innerhalb von Entwicklungsorganisationen drängen auf maximale Nutzung statt auf maximale Effizienz.
Der von Gartner genannte 5- bis 30-fache Token-Multiplikator für agentenbasierte Workflows gilt branchenweit . Allein Claude Code von Anthropic erreichte bis Februar 2026 einen annualisierten Umsatz von 2,5 Milliarden US-Dollar, nach 1 Milliarde US-Dollar im November 2025 – das ist der schnellste Anstieg für Unternehmenssoftware in der Geschichte
. Die Ausgaben sind real. Die Erträge sind es noch nicht.
Der Fall Uber wirft eine Herausforderung auf, die noch kein großes Unternehmen gelöst hat: Wie budgetiert man eine Technologie, deren Kosten mit der Nutzung skalieren, deren Output-Qualität schwer messbar ist und deren Einführung man fördern muss, um wettbewerbsfähig zu bleiben – und das alles, während der Finanzchef (Chief Financial Officer, CFO) eine klare Auswirkung auf die Gewinn- und Verlustrechnung sehen muss? Solange Unternehmen keine Steuerungsmodelle entwickeln, die Token-Ausgaben mit spezifischen, messbaren Geschäftsergebnissen verknüpfen, wird sich das „Tokenmaxxing“-Problem weit über Uber hinaus ausbreiten. Das Unternehmen, das es schafft, den wahren Return on Investment von KI zu messen und zu optimieren – und nicht nur den Token-Verbrauch –, wird einen Vorteil haben, der weit mehr zählt als jeder Ranglistenplatz.
Comments
0 comments