A maior fonte de raiva dos usuários era a natureza ilimitada, quase predatória, das novas cotas. Um único comando usando o Gemini 3.1 Pro com um arquivo grande em anexo podia consumir toda a franquia de cinco horas, tornando o serviço inutilizável para profissionais .
Em resposta, o Google introduziu um limite máximo de consumo de cota por comando. Isso não faz o sistema voltar à contagem simples por prompt, mas impede que uma única operação acione um bloqueio de várias horas instantaneamente. O resultado prático é que agora os usuários Pro conseguem fazer várias consultas complexas em uma janela de cinco horas, em vez de apenas uma .
Talvez o pecado original mais grave do sistema baseado em computação fosse que requisições que falhavam consumiam a cota. Um erro interno do servidor, um timeout ou um bug que não gerava nenhum resultado útil ainda assim descontava do medidor de uso.
Agora, o Google eliminou isso completamente. A cota é subtraída apenas para tarefas concluídas com sucesso. Woodward resumiu de forma clara: “Se uma solicitação falhar, você não será cobrado. Os erros do nosso sistema são por nossa conta, não sua” . Isso elimina uma fonte significativa de drenagem invisível de cota que fazia os limites parecerem ainda menores do que realmente eram.
Um bug específico na ferramenta de vídeo do Gemini Omni estava fazendo com que alguns usuários vissem sua cota inteira se esgotar depois de apenas uma ou duas gerações de vídeo . Esse bug era particularmente doloroso porque impossibilitava qualquer iteração ou correção de erros em um projeto de vídeo sem enfrentar um bloqueio total.
O Google confirmou que o bug foi resolvido. Para compensar e melhorar a oferta, a empresa dobrou simultaneamente o limite de geração de vídeo Omni para assinantes do Google AI Ultra, dando a eles mais fôlego de imediato .
Para dar a todos os usuários uma opção confiável que nunca os deixará na mão, o Google isentou os prompts do Gemini 3.1 Flash-Lite de todos os cálculos de cota. As consultas ao Flash-Lite agora custam zero de computação para os limites de cinco horas ou semanais . Isso garante que tarefas básicas de texto e codificação mais leve possam continuar sem interrupção, mesmo que sua cota Pro ou Ultra esteja completamente esgotada.
Grande parte da frustração original veio da falta de um medidor preciso. Os usuários muitas vezes não tinham ideia de que estavam se aproximando do limite até que o serviço os cortasse, especialmente porque um único prompt complexo podia saltar de 0% para 100% de consumo instantaneamente.
O Google se comprometeu a fornecer relatórios de uso mais detalhados e notificações aprimoradas, principalmente para tarefas pesadas como a Pesquisa Profunda . A empresa também está trabalhando em um painel de controle mais abrangente, que deve ajudar os usuários a entender seu consumo em tempo real, em vez de serem pegos de surpresa com uma parada brusca.
Uma pequena melhoria na qualidade de vida garante que o modelo escolhido (por exemplo, Gemini 3.1 Pro) permaneça fixo entre as sessões. Ele só mudará se você trocar manualmente ou se, ao atingir seu limite, for acionada uma migração automática para um modelo mais leve, como o Flash . Isso evita a experiência frustrante de começar uma tarefa no Pro e descobrir que o aplicativo silenciosamente te rebaixou.
É importante notar que a arquitetura central do novo sistema continua no lugar. O Google ainda usa um modelo baseado em computação, em vez de um simples baseado em mensagens, e a janela rotativa de cinco horas com um limite rígido semanal ainda se aplica aos planos pagos . A empresa também sinalizou que, eventualmente, pretende vender créditos de IA avulsos no esquema "pague pelo que usar" dentro do próprio app Gemini, permitindo que usuários pesados comprem mais poder computacional diretamente
.
Comments
0 comments