A chegada do Gemini 3.1 Flash-Lite à disponibilidade geral — ou GA, na sigla em inglês para general availability — não é apenas mais um item no catálogo de modelos do Google. Para equipes de IA corporativa, é uma decisão operacional com prazo: o modelo rápido e voltado a custo saiu do preview e ganhou um ID geralmente disponível, enquanto o endpoint de preview tem data curta para sair de cena [2].
Na prática, a pergunta deixa de ser “vale testar?” e passa a ser: quais cargas de trabalho migram primeiro, quanto a conta de tokens pode mudar e como fazer a troca sem quebrar fluxos em produção?
O que mudou com a disponibilidade geral
As notas de lançamento da Gemini API listam gemini-3.1-flash-lite como lançado em 7 de maio de 2026, descrevendo-o como a versão geralmente disponível do Gemini 3.1 Flash-Lite, otimizada para velocidade, escala e eficiência de custo [2]. O Google Cloud também afirma que o Gemini 3.1 Flash-Lite está geralmente disponível na Gemini Enterprise Agent Platform, a plataforma empresarial de agentes da empresa, e o descreve como projetado para latência ultrabaixa e tarefas de alto volume [
3].
A mudança de nome do modelo importa porque o endpoint de preview tem um cronograma de fim de vida. O gemini-3.1-flash-lite-preview começa a ser depreciado em 11 de maio de 2026 e está programado para ser desligado em 25 de maio de 2026 . Portanto, novas avaliações devem mirar o , enquanto implantações que ainda usam o preview precisam migrar antes da data de desligamento .



