Laut Googles Support‑Dokumentation gilt ungefähr folgende Staffelung:
Auf der Entwicklerkonferenz Google I/O 2026 stellte Google außerdem den neuen AI‑Ultra‑Tarif für rund 100 US‑Dollar pro Monat vor. In der Coding‑Umgebung Antigravity kann dieser Plan beispielsweise ein fünfmal höheres Nutzungslimit als AI Pro bieten.
Der entscheidende Unterschied zwischen den Tarifen liegt damit zunehmend nicht mehr nur bei Funktionen – sondern beim verfügbaren Rechenbudget.
Das größte Problem der Umstellung war für viele Nutzer die fehlende Vorhersagbarkeit.
Im alten System ließ sich relativ leicht abschätzen, wie viele Prompts noch übrig waren. Im neuen Modell hängt der Verbrauch jedoch stark von der Aufgabe ab. Ein komplexer Workflow kann die Quote viel schneller verbrauchen als erwartet.
Besonders betroffen waren Szenarien wie:
Berichten zufolge konnten intensive Arbeitsphasen das Fünf‑Stunden‑Kontingent oder sogar das Wochenlimit nach nur wenigen Sessions aufbrauchen.
Viele Nutzer – auch zahlende Abonnenten – reagierten entsprechend verärgert. Einige bezeichneten die Änderung als eine Art „Bait‑and‑Switch“, weil ihre Abos praktisch weniger nutzbar wirkten, obwohl Google die offiziellen Tarifstrukturen nicht reduziert hatte.
Die Kritik ließ nicht lange auf sich warten, vor allem aus der Entwickler‑Community. Besonders deutlich zeigte sich das im Tool Antigravity, Googles KI‑gestützter Coding‑Umgebung.
Kurz nach Einführung der neuen Limits reagierte Google mit mehreren Sofortmaßnahmen:
Wenig später folgte eine weitere Anpassung: Die Limits wurden erneut um das Dreifache erhöht, wodurch deutlich mehr Compute‑Budget verfügbar wurde.
Diese schnelle Nachbesserung deutet darauf hin, dass Google unterschätzt hatte, wie stark reale Workflows – insbesondere Programmierung und Agent‑Workflows – die neuen Quoten belasten würden.
Die Debatte um Gemini macht ein grundlegendes Problem der KI‑Industrie sichtbar.
Moderne KI‑Anfragen sind extrem unterschiedlich teuer. Eine kurze Textantwort kostet vergleichsweise wenig Rechenleistung. Dagegen können lange Kontext‑Analysen, Coding‑Agenten oder Video‑Generierung ein Vielfaches an Compute benötigen.
Für Anbieter sind einfache „Nachrichten‑Limits“ daher zunehmend unpraktisch. Ein Compute‑basiertes Modell spiegelt die realen Kosten besser wider.
Für Nutzer entsteht jedoch ein anderes Problem: Wenn der Verbrauch von komplexen, schwer sichtbaren Faktoren abhängt, wird es schwieriger einzuschätzen, wie viel Nutzung tatsächlich noch verfügbar ist.
Der Gemini‑Fall zeigt damit das zentrale Spannungsfeld vieler KI‑Produkte:
Je leistungsfähiger KI‑Assistenten werden – und je mehr Rechenleistung sie benötigen – desto schwieriger wird es für Anbieter, diese Balance dauerhaft zu halten.
Comments
0 comments