Hier ist die definitive Aufschlüsselung aller Änderungen, die Google seit den ersten Beschwerden am Gemini-Kontingentsystem vorgenommen hat.
Die größte Quelle des Nutzerzorns war die unbegrenzte, fast willkürlich wirkende Natur der neuen Kontingente. Eine einzelne, hochkomplexe Anfrage mit Gemini 3.1 Pro und einem großen Dateianhang konnte das gesamte Fünf-Stunden-Rechenbudget verschlingen und den Dienst für Profis unbrauchbar machen .
Als Reaktion darauf führte Google eine harte Obergrenze ein, wie viel Kontingent eine einzelne Anfrage verbrauchen darf. Dies macht das System zwar nicht rückgängig, aber es verhindert, dass eine einzige Operation sofort eine mehrstündige Sperre auslöst. Das praktische Ergebnis: Pro-Nutzer können jetzt mehrere komplexe Anfragen pro Fünf-Stunden-Fenster stellen, statt nur eine einzige .
Der vielleicht größte Geburtsfehler des rechenbasierten Systems war, dass auch gescheiterte Anfragen Kontingent verbrauchten. Ein interner Serverfehler, eine Zeitüberschreitung oder ein Bug, der kein verwertbares Ergebnis lieferte, zählte trotzdem gegen das Nutzungskonto.
Google hat dies nun komplett abgeschafft. Kontingent wird nur noch für erfolgreich abgeschlossene Vorgänge abgezogen. Woodward brachte es klar auf den Punkt: „Wenn eine Anfrage fehlschlägt, wird sie euch nicht berechnet. Unsere Systemfehler gehen auf unsere Kappe, nicht auf eure“ . Dies beseitigt eine bedeutende Quelle unsichtbaren Kontingentschwunds, der die Limits noch kleiner erscheinen ließ, als sie tatsächlich waren.
Ein spezifischer Bug im auf Gemini Omni basierenden Videotool führte dazu, dass einige Nutzer ihr gesamtes Kontingent bereits nach ein oder zwei Videogenerierungen aufgebraucht sahen . Dieser Fehler war besonders schmerzhaft, da er es unmöglich machte, ein Videoprojekt zu iterieren oder Fehler zu korrigieren, ohne eine vollständige Sperre zu riskieren.
Google bestätigte, dass der Fehler behoben wurde. Um dies zu kompensieren und das Angebot zu verbessern, verdoppelte das Unternehmen gleichzeitig das Omni-Videogenerierungslimit für Google AI Ultra-Abonnenten und verschaffte ihnen damit sofort mehr Spielraum .
Um allen Nutzern eine verlässliche Option zu bieten, die sie niemals im Regen stehen lässt, hat Google Gemini 3.1 Flash-Lite-Anfragen von sämtlichen Kontingentberechnungen ausgenommen. Flash-Lite-Anfragen kosten jetzt null Rechenpunkte im Hinblick auf die Fünf-Stunden- oder Wochenlimits . Dies garantiert, dass grundlegende Text- und einfachere Coding-Aufgaben ungestört weiterlaufen, selbst wenn das Pro- oder Ultra-Kontingent eines Nutzers vollständig aufgebraucht ist.
Ein Großteil der anfänglichen Frustration rührte vom Fehlen einer genauen Verbrauchsanzeige her. Nutzer hatten oft keine Ahnung, dass sie sich dem Limit näherten, bis der Dienst sie abklemmte – vor allem, weil eine einzelne komplexe Anfrage den Zähler sofort von 0 % auf 100 % springen lassen konnte.
Google verpflichtete sich, detailliertere Nutzungsaufschlüsselungen und verbesserte Benachrichtigungen bereitzustellen, insbesondere für rechenintensive Aufgaben wie Deep Research . Das Unternehmen arbeitet zudem an einem umfassenderen Dashboard, das Nutzern helfen soll, ihren Verbrauch in Echtzeit zu verstehen, anstatt von einem abrupten Stopp überrascht zu werden.
Eine kleinere, aber nützliche Verbesserung stellt sicher, dass das gewählte Modell (z. B. Gemini 3.1 Pro) über Sitzungen hinweg bestehen bleibt. Es wechselt nur, wenn man manuell umschaltet oder wenn das Erreichen des Limits eine automatische Rückstufung auf ein leichteres Modell wie Flash auslöst . Dies verhindert die frustrierende Erfahrung, eine Aufgabe mit Pro zu beginnen und später festzustellen, dass die App einen stillschweigend herabgestuft hat.
Es ist wichtig zu beachten, dass die Kernarchitektur des neuen Systems bestehen bleibt. Google verwendet weiterhin ein rechenbasiertes Modell anstelle eines einfachen nachrichtenbezogenen, und das rollierende Fünf-Stunden-Fenster mit einer harten wöchentlichen Obergrenze gilt weiterhin für kostenpflichtige Tarife . Das Unternehmen hat zudem signalisiert, dass es letztendlich plant, in der Gemini-App kostenpflichtige KI-Zusatzkontingente nach Verbrauch anzubieten, damit Intensivnutzer bei Bedarf mehr Rechenleistung direkt dazukaufen können
.
Comments
0 comments