Pour y remédier, Google instaure un plafond sur ce qu'une seule requête peut consommer. Cela n'équivaut pas un retour à l'ancien système, mais empêche une seule opération de déclencher un verrouillage de plusieurs heures. Résultat concret : un utilisateur Pro peut désormais enchaîner plusieurs requêtes complexes par fenêtre de cinq heures, au lieu d'une seule .
Le péché originel le plus criant du nouveau système était la facturation des échecs. Une erreur interne de serveur, un délai dépassé ou un bug pouvaient grignoter le quota sans fournir le moindre résultat. Une source d'agacement invisible qui réduisait encore plus les marges des utilisateurs.
Cette règle est totalement abolie : seules les requêtes abouties sont décomptées. Josh Woodward a résumé la philosophie du changement : « Si une requête échoue, vous ne serez pas facturés. Nos erreurs système sont pour nous, pas pour vous » . De quoi rassurer ceux qui redoutaient les aléas techniques.
Un bug spécifique affectait l'outil de création vidéo basé sur Gemini Omni. Pour certains utilisateurs, une ou deux générations vidéo suffisaient à épuiser tout leur quota, rendant impossible l'itération sur un projet créatif . Une pénalité d'autant plus frustrante qu'elle bloquait toute correction ou amélioration.
Le bug est désormais résolu. Pour compléter le geste, Google a doublé la limite de générations Omni pour les abonnés Google AI Ultra, leur offrant immédiatement plus de souplesse .
Pour offrir un filet de sécurité à tous les utilisateurs, les requêtes utilisant Gemini 3.1 Flash-Lite ne sont plus décomptées du quota. Ce modèle plus léger permet donc de poursuivre une conversation basique, une tâche de codage simple ou une recherche textuelle même quand le quota Pro ou Ultra est épuisé . Une manière de garantir la continuité du service, quel que soit l'état du compteur.
Une grande partie des frustrations initiales venait de l'absence d'un indicateur fiable. Les utilisateurs découvraient souvent le plafond en se faisant brutalement couper l'accès, sans avertissement préalable.
Google promet des notifications plus fines et un tableau de bord complet, en particulier pour les tâches gourmandes comme Deep Research . L'objectif est de permettre à chacun d'anticiper sa consommation, au lieu d'être confronté à une coupure soudaine.
Une amélioration de confort plus discrète mais bienvenue : le choix du modèle (par exemple, Gemini 3.1 Pro) est désormais conservé d'une session à l'autre. Il ne bascule que si vous changez manuellement, ou si un plafond atteint déclenche un repli automatique vers un modèle plus léger comme Flash .
Il faut souligner que l'architecture fondamentale du nouveau système reste en place. Google ne revient pas au simple comptage de requêtes : l'approche basée sur le calcul demeure, avec une fenêtre de cinq heures et un plafond hebdomadaire . L'entreprise a également confirmé qu'elle prévoit, à terme, de proposer des crédits d'IA à l'achat dans l'application Gemini, pour les utilisateurs intensifs qui souhaiteraient dépasser leurs limites
.
Comments
0 comments