Le retard est dû à des problèmes de qualité de performance découverts lors des premiers tests, et non à des problèmes de sécurité ou d'infrastructure . Selon Business Insider, Google utilise ce temps supplémentaire pour recueillir les retours des premiers testeurs et ajuster le modèle en fonction des cas d'utilisation réels en entreprise
. Des fuites sur les réseaux sociaux suggèrent que les premiers testeurs ont signalé que le modèle « devenait paresseux sur les tâches difficiles », incitant Google à repousser le lancement et à potentiellement intégrer des améliorations comme une mémoire de 2 millions de tokens et le raisonnement Deep Think
.
L'annonce de Pichai à l'I/O a mal posé les attentes. Sur scène, il a déclaré : « Je sais que vous avez hâte de l'essayer. Donnez-nous jusqu'au mois prochain pour vous le fournir » . Aucune raison spécifique n'a été donnée à ce moment-là pour expliquer pourquoi le modèle n'était pas prêt
. L'échéance de juin a ensuite été repoussée sans explication officielle, créant une perception de promesse non tenue
.
Gemini 3.5 Flash est devenu généralement disponible le 19 mai 2026 — le jour même de son annonce — et a immédiatement remis en cause la hiérarchie des modèles Pro .
Principaux résultats de benchmark rapportés par Google :
Google affirme que 3.5 Flash est environ 4 fois plus rapide en tokens de sortie par seconde que les autres modèles de pointe . Le prix de l'API est d'environ 1,50 $ en entrée / 9 $ en sortie par million de tokens, soit environ 40 % moins cher que Gemini 3.1 Pro en entrée
.
Sur 11 des 15 benchmarks publiés, Gemini 3.5 Flash bat Gemini 3.1 Pro . Cependant, il reste derrière le modèle Pro sur des benchmarks de raisonnement pur comme Humanity's Last Exam (40,2 % contre 44,4 %) et ARC-AGI-2 (72,1 % contre 77,1 %), ce qui signifie qu'il ne s'agit pas d'une mise à niveau directe sur toutes les dimensions
.
La réponse des développeurs a été très critique envers la communication et le rythme de Google.
Lorsque Gemini 3.5 Pro arrivera enfin, il devrait combler les lacunes de raisonnement que Flash présente encore. Les fonctionnalités confirmées incluent une fenêtre de contexte de 2 millions de tokens — la plus grande de tous les modèles de production — et un mode de raisonnement Deep Think . Le prix devrait être d'environ 1,50 $ en entrée / 9 $ en sortie par million de tokens, similaire à celui de Flash
.
Le retard, bien que frustrant pour les développeurs, pourrait finalement aboutir à un produit plus solide. Mais en faisant une promesse ferme de « le mois prochain » puis en gardant le silence lorsqu'elle n'a pas été tenue, Google a amplifié la frustration des développeurs dans un contexte de sorties régulières de ses concurrents.
En résumé : Le retard est lié à la qualité des performances, pas à la sécurité ou à l'infrastructure. Pendant ce temps, Gemini 3.5 Flash est déjà la meilleure option pour les charges de travail des agents en production — et il arrive comme une alternative rentable qui surpasse le modèle Pro de l'année dernière sur les benchmarks qui comptent le plus pour les développeurs.
Comments
0 comments