Na prática, isso significa que uma pergunta simples em texto consome muito pouco da cota, enquanto tarefas pesadas — como programação, agentes automatizados ou geração de vídeo — podem gastar muito mais recursos de uma só vez.
O sistema de cotas por computação vale para todos os usuários do Gemini, mas cada plano recebe um orçamento diferente.
Segundo a documentação de suporte do Google:
Durante o Google I/O 2026, a empresa também apresentou o plano AI Ultra de US$ 100 por mês, com limites significativamente maiores — incluindo até cinco vezes mais uso no ambiente de programação Antigravity em comparação ao AI Pro.
Com isso, a principal diferença entre planos deixou de ser apenas acesso a recursos e passou a ser quanto poder computacional o usuário pode consumir.
O principal problema relatado foi a falta de previsibilidade.
No modelo antigo, era relativamente fácil estimar quantos prompts ainda restavam. Já no novo sistema, como o consumo depende da complexidade da tarefa, o gasto de cota pode variar muito.
Alguns exemplos de atividades que consomem rapidamente o orçamento incluem:
Desenvolvedores relataram que algumas sessões intensivas eram suficientes para consumir o limite de cinco horas ou até uma grande parte do limite semanal.
Isso levou parte dos assinantes pagos a acusar o Google de um "bait and switch" — expressão usada quando um serviço parece oferecer uma coisa, mas na prática entrega menos valor após mudanças.
Diante da repercussão negativa, o Google respondeu rapidamente — principalmente no Antigravity, sua ferramenta de programação com IA.
Poucos dias após o lançamento das novas cotas:
Logo depois, os limites foram triplicados novamente, ampliando ainda mais a capacidade disponível para desenvolvedores.
Esses ajustes rápidos sugerem que o Google subestimou o quanto fluxos de trabalho reais — especialmente programação e automação com agentes — consumiriam do novo orçamento de computação.
A controvérsia evidencia um desafio crescente para empresas de IA.
Sistemas modernos não têm custos uniformes. Uma resposta simples em texto pode ser barata de gerar, enquanto tarefas com contexto longo, raciocínio complexo ou geração de vídeo exigem muito mais poder computacional.
Cotas baseadas em computação ajudam as empresas a alinhar o uso ao custo real da infraestrutura. Porém, isso cria um problema de experiência para o usuário: quando o limite depende de cálculos internos difíceis de entender, fica mais difícil prever quanto do serviço ainda está disponível.
O caso do Gemini mostra bem esse dilema. O sistema foi criado para refletir melhor o custo real da IA — mas acabou confundindo usuários e gerando reação negativa quase imediata.
À medida que assistentes de IA ficam mais avançados — e mais caros de rodar — as empresas do setor precisam equilibrar três fatores:
Encontrar esse equilíbrio provavelmente será um dos maiores desafios de produto para a indústria de IA nos próximos anos.
Comments
0 comments