Die Realität sieht jedoch anders aus: Anthropic hat bei der Preisgestaltung bereits aggressiv vorgelegt. Am 9. Juni, nur zwei Tage bevor die OpenAI-Geschichte publik wurde, brachte das Unternehmen das Modell Claude Fable 5 auf den Markt – für 10 US-Dollar pro Million Input-Token und 50 US-Dollar pro Million Output-Token, der halbe Preis des Vorgängermodells Mythos Preview. Das neue Modell erreichte 80,3 % im SWE-Bench Pro, ein Vorsprung von 22 Punkten gegenüber GPT-5.5 mit 58,6 % . Anthropic führte zudem einen achtmal günstigeren „Compact“-Modus ein und stellte bereits am 14. Mai sein Abo-Modell um: Intensivnutzer des Claude Agent SDK werden ab dem 15. Juni aus den Pauschal-Abos in eine verbrauchsabhängige API-Abrechnung überführt
.
Eine nüchterne Betrachtung der Wettbewerbslandschaft zeigt: OpenAI handelt hier nicht aus einer Position der Stärke. Die Preissenkungen sind die Antwort auf eine bereits verlorene Marktposition und keine großzügige Geste .
OpenAI-CEO Sam Altman räumte kürzlich auf einer Veranstaltung öffentlich ein, dass die Nutzungskosten für KI zu einem „riesigen Problem“ („a huge issue“) für Unternehmenskunden geworden sind . Alexander Embiricos, Leiter des Enterprise-Geschäfts bei OpenAI, beschrieb gegenüber TechCrunch einen fundamentalen Wandel in den Kundengesprächen: „Vor sechs Monaten drehte sich ein Kundengespräch nur darum: 'Was kann die KI? Ist sie gut genug?' Darum geht es heute überhaupt nicht mehr. Jetzt fragen die Kunden: 'Hey, wir geben so viel Geld aus. Welche Transparenz haben wir? Welche Prüfbarkeit? Welche Token-Kontrollen gibt es?'“
.
Das Ausmaß der Unternehmensausgaben ist atemberaubend. Altman verriet, dass ein einzelner OpenAI-Poweruser monatlich 100 Milliarden Token verbraucht – das entspricht bei gemischten Unternehmenstarifen etwa 100.000 bis 300.000 US-Dollar pro Monat . Altman erklärte, das Unternehmen wolle KI künftig „wie Strom“ („like electricity“) abrechnen – ein verbrauchsabhängiges Modell, das in der Theorie verlockend klingt, für Finanzchefs aber zum Albtraum wird, wenn der Zähler niemals stillsteht
.
Beide Unternehmen betrachten Entwickler-Tools als entscheidenden Brückenkopf für die Einführung von KI in Unternehmen. OpenAI senkte den Preis für sein „Pro“-Abonnement im April 2026 auf 100 US-Dollar pro Monat, gezielt um die Codex-Programmiertools für professionelle Entwickler günstiger zu machen . Anthropics Claude Code und das Agent SDK positionieren sich als direkte Alternativen.
Die Umstellung des Kreditmodells bei Anthropic im Juni hob de facto eine 15- bis 30-fache Subvention auf, die die intensive SDK-Nutzung unter Pauschaltarifen künstlich billig gemacht hatte. Das wird die Kosten für die stärksten Claude-Code-Nutzer erheblich erhöhen . Der Zeitpunkt der von OpenAI berichteten Preissenkungen – nur wenige Tage nach dem Modell-Launch von Anthropic und kurz vor der Abrechnungsänderung am 15. Juni – legt einen bewussten Versuch nahe, diesen Moment des Kundenschocks auszunutzen.
Die Preiskrise ist ohne die gleichzeitige Implosion des „Tokenmaxxing“-Produktivitätsversprechens nicht zu verstehen. Tokenmaxxing – der Ansatz, den KI-Token-Verbrauch als Maßstab für Ingenieursproduktivität heranzuziehen – wurde in den Jahren 2025 und Anfang 2026 zur internen Kultur im Silicon Valley. Die New York Times berichtete im März, dass ein OpenAI-Ingenieur in einer einzigen Woche 210 Milliarden Token verarbeitete, und bei Amazon erstellten einige Mitarbeiter KI-Agenten für „vollkommen sinnlose oder unnötige Aufgaben“, nur um ihre Token-Verbrauchsstatistiken oben zu halten .
Doch die Datenlage hat sich entschieden gegen diese Praxis gewandt. Das Analyseunternehmen Faros AI wertete Daten von 22.000 Entwicklern aus 4.000 Teams aus und stellte fest: Während die KI-Nutzung den Aufgabendurchsatz beschleunigte (Aufgabenabschluss +34 %, Epics +66 %), stiegen gleichzeitig die Fehler pro Entwickler um 54 %, die mediane Code-Review-Zeit verfünffachte sich und die Code-Änderungsrate (Code Churn) schoss in Umgebungen mit hoher KI-Nutzung um unglaubliche 861 % in die Höhe .
Anfängliche Code-Übernahmequoten von 80 bis 90 %, die von Managern bejubelt wurden, entpuppten sich als Fata Morgana. Als Forscher die Code-Überarbeitungen in den folgenden Wochen verfolgten, stürzte die reale Übernahmequote auf 10 bis 30 % ab – ein Hinweis auf eine erhebliche versteckte technische Schuldenlast . Das Unternehmen Jellyfish fand heraus, dass die oberen 10 % der Claude-Code-Nutzer rund zehnmal so viele Token verbrauchten wie der durchschnittliche Entwickler, aber nur etwa die doppelte Leistung produzierten
. Die Kosten pro zusammengeführter Code-Änderung (Pull Request) stiegen laut Daten von Jellyfish von 0,28 US-Dollar bei leichter KI-Nutzung auf bis zu 89 US-Dollar bei intensiver Nutzung
.
Auch über den Ingenieursbereich hinaus bröckelt die Produktivitätsargumentation. Der „Global AI at Work“-Report 2026 von BCG, für den fast 12.000 Mitarbeiter befragt wurden, ergab, dass 42 % der regelmäßigen KI-Nutzer angaben, acht Stunden pro Woche – einen ganzen Arbeitstag – einzusparen. Aber 66 % sagten, sie hätten kaum oder keine Anleitung erhalten, was sie mit der eingesparten Zeit anfangen sollen, und die Hälfte gab an, nicht messbar produktiver zu sein . Der COO von Uber, Andrew Macdonald, räumte ein, dass das Unternehmen Schwierigkeiten habe, den Produktivitätsschub einzelner Mitarbeiter mit einer unternehmensweiten Wirkung zu verknüpfen
.
Chris Bedi, Chief Customer Officer bei ServiceNow, brachte die wachsende Skepsis unverblümt auf den Punkt: „Es ist fast so, als würde man den Erfolg eines Restaurants daran messen, wie viele Lebensmittel es einkauft, und nicht daran, wie viele zufriedene Gäste es verlassen. Für diese Token muss eine Rechnung bezahlt werden“ .
Das Gespräch mit Unternehmen hat sich von „Macht schneller!“ zu „Wir brauchen Leitplanken!“ gewandelt . Dieser Wandel bedroht direkt das Umsatz-Kernmodell von KI-Anbietern, die von unbegrenzter Nutzung profitieren.
Sowohl OpenAI als auch Anthropic bereiten sich laut Berichten auf Börsengänge vor . Dieser Zeitplan macht die wirtschaftlichen Folgen eines Preiskriegs besonders gefährlich. Aggressive Token-Preissenkungen drücken die Margen genau zu dem Zeitpunkt, an dem beide Unternehmen den Investoren am öffentlichen Markt nachhaltige Einheitsökonomien demonstrieren müssen. Preissenkungen ohne entsprechende Reduzierung der enormen Rechenkosten für Training und Inferenz könnten die Rentabilität noch schwerer erreichbar machen
.
Die tiefere Sorge der Investoren betrifft jedoch die Wechselkosten – oder besser deren Fehlen. Eine Umfrage von Wakefield Research unter 200 Führungskräften im März und April 2026 ergab, dass 79 % leicht oder stark besorgt über eine zu starke Bindung (Lock-in) an ihren aktuellen KI-Anbieter sind . Wenn die Ergebnisse eines KI-Modells für eine bestimmte Aufgabe ungefähr so gut sind wie die eines anderen und die API-Integration relativ einfach ist, können Unternehmenskunden mit minimalem Aufwand zur günstigeren Option wechseln.
Die Ära der KI-Flatrate ist vorbei . Was an ihrer Stelle entsteht, ähnelt weniger einem Plattformkrieg mit einem klaren Gewinner als vielmehr einem Verdrängungswettbewerb, bei dem der Anbieter mit den niedrigsten Kosten überlebt. OpenAIs Plan, die Preise zu senken, ist im Kern das Eingeständnis, dass das eigene Produkt nicht differenziert genug ist, um einen Premiumpreis zu erzielen, wenn die Kunden jeden einzelnen Token unter die Lupe nehmen.
Comments
0 comments