El retraso se debe a problemas de calidad de rendimiento descubiertos en las pruebas tempranas, no a problemas de seguridad o infraestructura . Según Business Insider, Google está utilizando el tiempo extra para recopilar comentarios de los probadores tempranos y ajustar el modelo basándose en casos de uso empresarial reales
. Filtraciones en redes sociales sugieren que los probadores tempranos reportaron que el modelo "se volvía perezoso en tareas difíciles", lo que llevó a Google a retrasar el lanzamiento y potencialmente incluir mejoras como memoria de 2 millones de tokens y razonamiento Deep Think
.
El anuncio de Pichai en el I/O generó expectativas poco realistas. En el escenario, dijo: "Sé que están ansiosos por probarlo. Dennos hasta el próximo mes para entregárselos" . En ese momento no se dio ninguna razón específica de por qué el modelo no estaba listo
. El plazo de junio luego se desvaneció sin una explicación oficial, creando la percepción de una promesa incumplida
.
Gemini 3.5 Flash se lanzó de forma general el 19 de mayo de 2026, el mismo día en que se anunció, y desafió inmediatamente la jerarquía de nivel Pro .
Resultados clave de las pruebas comparativas publicadas por Google:
Google afirma que 3.5 Flash se ejecuta aproximadamente 4 veces más rápido en tokens de salida por segundo que otros modelos de frontera . El precio de la API es de aproximadamente $1.50 de entrada / $9 de salida por millón de tokens, aproximadamente un 40 % más barato que Gemini 3.1 Pro en la entrada
.
En 11 de 15 pruebas comparativas publicadas, Gemini 3.5 Flash supera a Gemini 3.1 Pro . Sin embargo, todavía está por detrás del modelo Pro en pruebas de razonamiento puro como Humanity's Last Exam (40.2 % frente a 44.4 %) y ARC-AGI-2 (72.1 % frente a 77.1 %), por lo que no es una mejora directa en todas las dimensiones
.
La respuesta de los desarrolladores ha sido muy crítica con la comunicación y el ritmo de Google.
Cuando Gemini 3.5 Pro llegue, se espera que cierre las brechas de razonamiento que Flash todavía muestra. Las características confirmadas incluyen una ventana de contexto de 2 millones de tokens — la más grande de cualquier modelo de producción — y un modo de razonamiento Deep Think . Se espera que el precio sea de aproximadamente $1.50 de entrada / $9 de salida por millón de tokens, similar al nivel Flash
.
El retraso, aunque frustrante para los desarrolladores, podría resultar en un producto más sólido. Pero al hacer una promesa firme de "el próximo mes" y luego guardar silencio cuando no se cumplió, Google ha amplificado la frustración de los desarrolladores en un contexto de lanzamientos constantes de la competencia.
En resumen: El retraso se debe a la calidad del rendimiento, no a la seguridad o la infraestructura. Mientras tanto, Gemini 3.5 Flash ya es la mejor opción para cargas de trabajo de agentes de producción — y llega como una alternativa rentable que supera al modelo Pro del año pasado en las pruebas comparativas que más importan a los desarrolladores.
Comments
0 comments