RespostasPublicadohá 2 mesesLast edited mês passado20 fontes

Por que os novos limites de uso do Gemini baseados em computação geraram críticas

Em maio de 2026, o Google substituiu o limite diário de prompts do Gemini por cotas baseadas em consumo de computação que se renovam a cada cinco horas até atingir um limite semanal, levando usuários a atingir o teto... O novo sistema vale para planos gratuitos e pagos, mas cada assinatura recebe um orçamento de com...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

Illustration of AI compute limits and usage quotas affecting Google Gemini users — How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt countsGemini’s new usage model measures compute consumption rather than simple prompt counts, reflecting the real cost of modern AI workloads.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt counts. Article summary: Google replaced Gemini’s old daily prompt-count system with compute-based quotas that refresh every five hours until a weekly cap is reached, and usage now depends on prompt complexity, features/models used, and chat len. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "Google is changing how it calculates your weekly Gemini usage limits, and it’s another reflection of how powerful agentic AI features have broken flat-rate consumer AI plans. As of" source context "Google just made big changes to Gemini usage limits - PCWorld" Reference image 2: visual subject "Google is changing how it calculat
openai.com

Em maio de 2026, o Google alterou de forma significativa a maneira como o assistente de IA Gemini mede o uso. Em vez de limitar o número de prompts que um usuário pode enviar por dia, a plataforma passou a usar cotas baseadas em computação, que estimam quanta capacidade de processamento cada interação consome.

A mudança pretende refletir melhor o custo real de executar modelos de IA modernos. Porém, assim que entrou em vigor, muitos usuários perceberam que estavam atingindo os limites muito mais rápido do que antes — o que gerou críticas imediatas.

Do limite de prompts para orçamento de computação

Antes da atualização, o Gemini funcionava com uma lógica simples: havia um número máximo de prompts por dia. Era fácil de entender e prever.

A partir de 17 de maio de 2026, o Google passou a calcular o uso com base no consumo de computação, não mais na quantidade de mensagens enviadas.

No novo modelo, a quantidade de cota usada depende de fatores como:

Complexidade do prompt
Modelo ou recurso utilizado (como raciocínio avançado ou geração de mídia)
Duração e tamanho da conversa

Além disso, os limites não são mais diários. Agora eles se renovam a cada cinco horas, até que o usuário atinja um limite semanal total.

Na prática, isso significa que uma pergunta simples em texto consome muito pouco da cota, enquanto tarefas pesadas — como programação, agentes automatizados ou geração de vídeo — podem gastar muito mais recursos de uma só vez.

O impacto nos planos gratuitos e pagos

O sistema de cotas por computação vale para todos os usuários do Gemini, mas cada plano recebe um orçamento diferente.

Segundo a documentação de suporte do Google:

Usuários gratuitos: recebem limites padrão.
AI Plus: cerca de 2× mais capacidade que o plano gratuito.
AI Pro: aproximadamente 4× mais capacidade que o plano gratuito.
AI Ultra: limites muito maiores, dependendo do produto e das ferramentas utilizadas.

Durante o Google I/O 2026, a empresa também apresentou o plano AI Ultra de US$ 100 por mês, com limites significativamente maiores — incluindo até cinco vezes mais uso no ambiente de programação Antigravity em comparação ao AI Pro.

Com isso, a principal diferença entre planos deixou de ser apenas acesso a recursos e passou a ser quanto poder computacional o usuário pode consumir.

Por que muitos usuários atingiram os limites tão rápido

O principal problema relatado foi a falta de previsibilidade.

No modelo antigo, era relativamente fácil estimar quantos prompts ainda restavam. Já no novo sistema, como o consumo depende da complexidade da tarefa, o gasto de cota pode variar muito.

Alguns exemplos de atividades que consomem rapidamente o orçamento incluem:

Sessões longas de programação
Fluxos de trabalho com agentes de IA
Uso de recursos avançados de raciocínio ou geração de mídia

Desenvolvedores relataram que algumas sessões intensivas eram suficientes para consumir o limite de cinco horas ou até uma grande parte do limite semanal.

Isso levou parte dos assinantes pagos a acusar o Google de um "bait and switch" — expressão usada quando um serviço parece oferecer uma coisa, mas na prática entrega menos valor após mudanças.

A reação rápida do Google

Diante da repercussão negativa, o Google respondeu rapidamente — principalmente no Antigravity, sua ferramenta de programação com IA.

Poucos dias após o lançamento das novas cotas:

O Google triplicou os limites de uso dos modelos Gemini no Antigravity.
A empresa também resetou as cotas semanais dos usuários, permitindo que continuassem trabalhando imediatamente.

Logo depois, os limites foram triplicados novamente, ampliando ainda mais a capacidade disponível para desenvolvedores.

Esses ajustes rápidos sugerem que o Google subestimou o quanto fluxos de trabalho reais — especialmente programação e automação com agentes — consumiriam do novo orçamento de computação.

O que esse episódio revela sobre a economia da IA

A controvérsia evidencia um desafio crescente para empresas de IA.

Sistemas modernos não têm custos uniformes. Uma resposta simples em texto pode ser barata de gerar, enquanto tarefas com contexto longo, raciocínio complexo ou geração de vídeo exigem muito mais poder computacional.

Cotas baseadas em computação ajudam as empresas a alinhar o uso ao custo real da infraestrutura. Porém, isso cria um problema de experiência para o usuário: quando o limite depende de cálculos internos difíceis de entender, fica mais difícil prever quanto do serviço ainda está disponível.

O caso do Gemini mostra bem esse dilema. O sistema foi criado para refletir melhor o custo real da IA — mas acabou confundindo usuários e gerando reação negativa quase imediata.

À medida que assistentes de IA ficam mais avançados — e mais caros de rodar — as empresas do setor precisam equilibrar três fatores:

Custos crescentes de computação para modelos avançados
Limites claros e previsíveis para os usuários
Planos de assinatura que continuem parecendo vantajosos

Encontrar esse equilíbrio provavelmente será um dos maiores desafios de produto para a indústria de IA nos próximos anos.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "Por que os novos limites de uso do Gemini baseados em computação geraram críticas" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Após críticas de desenvolvedores e usuários avançados, o Google reagiu rapidamente: triplicou os limites do Gemini na ferramenta de programação Antigravity e redefiniu cotas semanais para permitir que as pessoas conti...

Fontes

← Back to Trending