O atraso decorre de problemas de qualidade de desempenho descobertos em testes iniciais, e não de questões de segurança ou infraestrutura . De acordo com o Business Insider, o Google está usando o tempo extra para coletar feedback de testadores iniciais e ajustar o modelo com base em casos de uso reais de negócios
. Vazamentos nas redes sociais sugerem que testadores iniciais relataram que o modelo "estava ficando preguiçoso em tarefas difíceis", levando o Google a adiar o lançamento e potencialmente incluir melhorias como memória de 2 milhões de tokens e o modo de raciocínio Deep Think
.
O anúncio de Pichai no I/O gerou expectativas negativas. No palco, ele disse: "Eu sei que vocês estão ansiosos para usar. Nos dê até o mês que vem para entregá-lo a vocês" . Nenhuma razão específica foi dada na época para explicar por que o modelo não estava pronto
. O prazo de junho então passou sem nenhuma explicação oficial, criando a percepção de uma promessa não cumprida
.
O Gemini 3.5 Flash foi disponibilizado ao público em 19 de maio de 2026 — no mesmo dia em que foi anunciado — e imediatamente desafiou a hierarquia da camada Pro .
Principais resultados de benchmark divulgados pelo Google:
O Google afirma que o 3.5 Flash é cerca de 4x mais rápido em tokens de saída por segundo do que outros modelos de fronteira . O preço da API é de aproximadamente US$ 1,50 de entrada / US$ 9 de saída por milhão de tokens, cerca de 40% mais barato que o Gemini 3.1 Pro na entrada
.
Em 11 dos 15 benchmarks publicados, o Gemini 3.5 Flash supera o Gemini 3.1 Pro . No entanto, ele ainda fica atrás do modelo Pro em benchmarks de raciocínio puro, como o Humanity's Last Exam (40,2% contra 44,4%) e o ARC-AGI-2 (72,1% contra 77,1%), portanto não é uma atualização linear em todas as dimensões
.
A resposta dos desenvolvedores tem sido fortemente crítica à comunicação e ao ritmo do Google.
Quando o Gemini 3.5 Pro finalmente chegar, espera-se que ele feche as lacunas de raciocínio que o Flash ainda apresenta. As funcionalidades confirmadas incluem uma janela de contexto de 2 milhões de tokens — a maior de qualquer modelo em produção — e um modo de raciocínio Deep Think . O preço deve ser de aproximadamente US$ 1,50 de entrada / US$ 9 de saída por milhão de tokens, semelhante ao da camada Flash
.
O atraso, embora frustrante para os desenvolvedores, pode resultar em um produto final mais forte. Mas ao fazer uma promessa firme de "mês que vem" e depois ficar em silêncio quando o prazo estourou, o Google amplificou a frustração dos desenvolvedores em meio a um cenário de lançamentos constantes dos concorrentes.
Resumo: O atraso é devido à qualidade de desempenho, não à segurança ou infraestrutura. Enquanto isso, o Gemini 3.5 Flash já é a melhor opção para cargas de trabalho de agentes em produção — e chega como uma alternativa custo-efetiva que supera o modelo Pro do ano anterior nos benchmarks que mais importam para os desenvolvedores.
Comments
0 comments