Después apareció otro texto atribuido a la app móvil de Gemini: «Meet our new video model. Remix your videos, edit directly in chat, try a template, and more». Si esa cadena es auténtica, Omni no sería solo un nombre técnico escondido en el backend: apuntaría a una experiencia de producto para crear, remezclar y editar video dentro de Gemini.
También circulan reportes sobre demos tempranas y clips virales. Gadgets360 afirma que esas pruebas mostrarían movimiento más realista, texto más limpio y mejor composición de escenas, mientras que un video de YouTube generado por usuarios habla de dos clips compartidos en X con metadatos que supuestamente apuntaban a «Google Gemini Omni Mode». Esa parte es mucho más débil que las cadenas de interfaz: Google no ha anunciado oficialmente Omni en las fuentes disponibles y esos clips no están verificados de forma independiente como salidas de Omni.
Si las cadenas filtradas son correctas, Omni parece orientado a cuatro funciones de cara al usuario:
Ese es el ángulo de producto más claro. La filtración no confirma duración de los clips, resolución, acceso por API, límites de prompts, velocidad de generación, calidad de audio, comportamiento de seguridad ni precio.
Veo 3.1 es el punto de comparación oficial. Google lanzó Veo 3.1 y Veo 3.1 Fast en vista previa de pago a través de Gemini API, Google AI Studio y Vertex AI, y dijo que los modelos también estaban disponibles en la app de Gemini y en Flow. La compañía describió Veo 3.1 como una actualización con audio nativo más rico, mayor control narrativo y mejores resultados al generar video a partir de imágenes.
Google también ha seguido ampliando la familia Veo 3.1. En enero de 2026, dijo que Veo 3.1 podía crear videos más expresivos desde imágenes, generar videos verticales para plataformas como YouTube Shorts y escalar resultados a 1080p o 4K en productos como Gemini, Flow, Gemini API, Vertex AI y Google Vids. En marzo de 2026, presentó Veo 3.1 Lite como su modelo de video más rentable, con un costo inferior al 50% de Veo 3.1 Fast y la misma velocidad.
Con ese contexto, la filtración de Omni no prueba un salto simple de especificaciones. Lo más claro no es «más resolución» o «más segundos», sino el flujo: plantillas, edición por chat y remix dentro de Gemini. Los reportes que hablan de mejor movimiento, texto más limpio o composición superior pueden terminar siendo ciertos, pero todavía no están respaldados por una ficha técnica de Google, un benchmark público o una prueba reproducible.
Las tres opciones siguen abiertas.
Una posibilidad es que Omni sea una nueva etiqueta para una ruta de video ya existente o mejorada dentro de Gemini. WaveSpeed afirma que la cadena «Powered by Omni» apareció cerca de «Toucan», descrito allí como el nombre interno de la herramienta de video actual de Gemini basada en Veo 3.1. Si esa ubicación es correcta, Omni podría ser una ruta de reemplazo, una bandera de prueba o el nombre visible de un nuevo pipeline de generación.
Otra posibilidad es que Omni sea realmente un modelo de video nuevo. El texto atribuido a la app dice «Meet our new video model», y Gadgets360 describe Gemini Omni como un modelo que permitiría crear y editar videos directamente dentro de Gemini.
La tercera hipótesis es más ambiciosa: que Omni forme parte de un sistema multimodal más amplio. Algunos recopilatorios especulan con que podría unificar texto, imagen, video y audio —o razonamiento multimodal— bajo una sola arquitectura de Gemini. Es una dirección plausible para un producto de IA, pero sigue siendo especulación en las fuentes disponibles. Google no ha confirmado si «Omni» es un nombre público, un codename interno, una familia de modelos, una capa de interfaz o una arquitectura más amplia.
No hay suficientes datos verificados para decir cuánto costaría usar Omni o ejecutarlo. Los reportes disponibles no confirman precio, latencia, cuotas, duración máxima de generación, tamaño del modelo, disponibilidad por API ni requisitos de cómputo.
El mejor punto de comparación sigue siendo Veo, donde Google ya segmenta la familia por costo y rendimiento. Veo 3.1 Lite fue presentado como una opción más barata, por menos de la mitad del costo de Veo 3.1 Fast, manteniendo la misma velocidad. Eso muestra que Google está pensando en la economía de la generación de video, pero no permite concluir si Omni será caro, limitado, exclusivo para usuarios premium o pensado para desarrolladores.
Por ahora, cualquier afirmación de que Omni es lento, costoso, limitado a pruebas internas o restringido a clips cortos debe tratarse como no confirmada salvo que Google o un tester verificable publique pruebas.
Con la evidencia actual no se puede hacer un ranking serio frente a Runway, Pika u OpenAI Sora. Las fuentes disponibles no ofrecen datos comparables de benchmark, y la propia evidencia sobre Omni no basta para evaluar realismo, control creativo, duración, consistencia temporal, sistemas de seguridad o costo.
La comparación defendible es de posicionamiento. Si la copia filtrada de Gemini es precisa, Google estaría intentando competir no solo por calidad de salida, sino por flujo de trabajo: pedir un video desde Gemini, elegir una plantilla, remezclar un clip y editarlo por chat en la misma interfaz. Eso podría diferenciarlo de herramientas de video con IA más independientes, pero no demuestra que Omni supere a Sora, Runway o Pika en calidad visual.
Las preguntas clave para I/O son bastante concretas:
Hasta que esas respuestas lleguen, la filtración de Omni debe leerse como una señal creíble de hacia dónde podría moverse Google en video con IA, no como una hoja de especificaciones confirmada. La historia, por ahora, está en las cadenas de la app; lo demás todavía necesita que Google lo haga oficial.
Comments
0 comments