Concrètement, une question courte peut consommer très peu de quota, tandis qu’une session longue utilisant des outils avancés — par exemple pour coder — peut épuiser la réserve beaucoup plus vite. Google explique que ce système reflète mieux la réalité : certaines tâches d’IA demandent bien plus de ressources de calcul que d’autres.
Le système de quotas basé sur le calcul s’applique à tous les niveaux d’abonnement Gemini, mais chaque formule dispose d’un budget différent.
D’après la documentation officielle de Google :
Lors de Google I/O 2026, l’entreprise a également annoncé un nouveau forfait AI Ultra à 100 $ par mois, conçu pour les usages intensifs. Par exemple, dans l’environnement de développement Antigravity, ce plan offre cinq fois plus de limite d’utilisation que l’offre AI Pro.
Autrement dit, la principale différence entre les abonnements n’est plus seulement l’accès à certaines fonctionnalités, mais la quantité de puissance de calcul disponible.
Le principal problème a été la prévisibilité.
Avec l’ancien système, les utilisateurs pouvaient facilement estimer combien de requêtes il leur restait. Avec les quotas basés sur le calcul, cette estimation devient beaucoup plus difficile.
Comme la consommation dépend de la complexité des tâches, certaines activités peuvent épuiser rapidement le quota, par exemple :
Plusieurs développeurs ont signalé que quelques sessions de travail intensives suffisaient parfois à atteindre le plafond de cinq heures, voire la limite hebdomadaire.
Certains abonnés payants ont alors accusé Google d’un « bait and switch » (promesse trompeuse), estimant que leur abonnement offrait en pratique moins d’utilisation qu’auparavant — même si les niveaux d’abonnement n’avaient pas officiellement changé.
Face aux critiques, Google a réagi rapidement, notamment dans Antigravity, son outil de développement assisté par IA.
Quelques jours seulement après le lancement du nouveau système :
Peu après, les limites ont encore été multipliées par trois une seconde fois pour les développeurs utilisant l’outil.
Ces ajustements rapides suggèrent que Google avait sous‑estimé la vitesse à laquelle les flux de travail réels — notamment le développement logiciel et les agents automatisés — consommeraient les nouveaux quotas.
La polémique autour de Gemini met en lumière un défi croissant pour toute l’industrie de l’intelligence artificielle.
Les systèmes d’IA modernes n’ont pas un coût uniforme. Une réponse textuelle simple peut coûter très peu à générer, alors que des tâches comme le raisonnement complexe, les agents de programmation ou la génération vidéo peuvent consommer énormément de ressources informatiques.
Les quotas basés sur le calcul permettent donc aux entreprises d’aligner les limites d’utilisation sur leurs coûts réels d’infrastructure. Mais ce modèle introduit aussi un problème d’expérience utilisateur : lorsque les limites reposent sur des calculs opaques, il devient difficile pour les utilisateurs de savoir combien d’utilisation il leur reste.
Le cas de Gemini illustre bien ce dilemme. Un système conçu pour mieux refléter les coûts techniques a rapidement semé la confusion — et provoqué une réaction négative.
Pour les entreprises d’IA qui exploitent des modèles de plus en plus puissants, le défi est désormais de trouver l’équilibre entre :
À mesure que les assistants d’IA deviennent plus performants — et plus gourmands en calcul — cette équation risque de devenir l’un des principaux défis produit du secteur.
Comments
0 comments