¿Cuáles son los puntos clave a validar primero?

La señal más sólida es una cadena en la pestaña de generación de video de Gemini: «Start with an idea or try a template. Si el texto es correcto, Omni apuntaría a un flujo con plantillas, remix y edición en chat, más que a una mejora ya demostrada en resolución, duración o costo.[2][6][7]

¿Qué debo hacer a continuación en la práctica?

Los clips virales y supuestas demos siguen sin verificación: Google aún no ha aclarado si Omni es una marca, un modelo nuevo, un sucesor de Veo o una arquitectura multimodal.[6][9]

Gemini Omni: la pista más clara sobre el próximo modelo de video de Google | Respuesta

studioglobal

La filtración de Gemini Omni hay que leerla con lupa. Lo interesante no es que exista ya una ficha técnica o un benchmark público —no los hay—, sino que las pistas aparecen dentro de la propia experiencia de generación de video de Gemini. La lectura más prudente: Google podría estar preparando un flujo de video más integrado en Gemini de cara a Google I/O 2026, pero la evidencia pública sigue apoyándose sobre todo en textos de interfaz y reportes de terceros.

Qué se filtró realmente

La prueba más citada es una línea de la interfaz en la pestaña de generación de video de Gemini: «Start with an idea or try a template. Powered by Omni». El hallazgo se atribuye al usuario de X @Thomas16937378, y varios recopilatorios de filtraciones señalan que después fue retomado por TestingCatalog y otros observadores de funciones de IA de Google.

La frase importa por dos motivos. Primero, porque sitúa «Omni» dentro de un flujo de creación de video, no en un menú genérico de ajustes ni en un experimento sin contexto. Segundo, porque la mención a «try a template» sugiere una experiencia más guiada que el típico cuadro de texto para pedir un video desde cero.

Después apareció otro texto atribuido a la app móvil de Gemini: «Meet our new video model. Remix your videos, edit directly in chat, try a template, and more». Si esa cadena es auténtica, Omni no sería solo un nombre técnico escondido en el backend: apuntaría a una experiencia de producto para crear, remezclar y editar video dentro de Gemini.

También circulan reportes sobre demos tempranas y clips virales. Gadgets360 afirma que esas pruebas mostrarían movimiento más realista, texto más limpio y mejor composición de escenas, mientras que un video de YouTube generado por usuarios habla de dos clips compartidos en X con metadatos que supuestamente apuntaban a «Google Gemini Omni Mode». Esa parte es mucho más débil que las cadenas de interfaz: Google no ha anunciado oficialmente Omni en las fuentes disponibles y esos clips no están verificados de forma independiente como salidas de Omni.

Las funciones que sí insinúan los textos

Si las cadenas filtradas son correctas, Omni parece orientado a cuatro funciones de cara al usuario:

Plantillas para crear video. La frase «start with an idea or try a template» sugiere formatos predefinidos o flujos guiados para quien no quiera empezar con un prompt en blanco.
Remix de videos. El texto atribuido a la app móvil menciona explícitamente la posibilidad de remezclar videos.
Edición directamente en el chat. Varios reportes describen Omni como una herramienta que permitiría crear y editar videos generados por IA dentro de la interfaz conversacional de Gemini.
Integración más profunda con Gemini. La pista aparece en la experiencia de generación de video de Gemini, lo que sugiere que Google podría presentarlo como una parte nativa de Gemini y no como una app separada.

Ese es el ángulo de producto más claro. La filtración no confirma duración de los clips, resolución, acceso por API, límites de prompts, velocidad de generación, calidad de audio, comportamiento de seguridad ni precio.

Frente a Veo 3.1: no es solo una cuestión de «mejores gráficos»

Veo 3.1 es el punto de comparación oficial. Google lanzó Veo 3.1 y Veo 3.1 Fast en vista previa de pago a través de Gemini API, Google AI Studio y Vertex AI, y dijo que los modelos también estaban disponibles en la app de Gemini y en Flow. La compañía describió Veo 3.1 como una actualización con audio nativo más rico, mayor control narrativo y mejores resultados al generar video a partir de imágenes.

Google también ha seguido ampliando la familia Veo 3.1. En enero de 2026, dijo que Veo 3.1 podía crear videos más expresivos desde imágenes, generar videos verticales para plataformas como YouTube Shorts y escalar resultados a 1080p o 4K en productos como Gemini, Flow, Gemini API, Vertex AI y Google Vids. En marzo de 2026, presentó Veo 3.1 Lite como su modelo de video más rentable, con un costo inferior al 50% de Veo 3.1 Fast y la misma velocidad.

Con ese contexto, la filtración de Omni no prueba un salto simple de especificaciones. Lo más claro no es «más resolución» o «más segundos», sino el flujo: plantillas, edición por chat y remix dentro de Gemini. Los reportes que hablan de mejor movimiento, texto más limpio o composición superior pueden terminar siendo ciertos, pero todavía no están respaldados por una ficha técnica de Google, un benchmark público o una prueba reproducible.

¿Cambio de marca, modelo nuevo o arquitectura multimodal?

Las tres opciones siguen abiertas.

Una posibilidad es que Omni sea una nueva etiqueta para una ruta de video ya existente o mejorada dentro de Gemini. WaveSpeed afirma que la cadena «Powered by Omni» apareció cerca de «Toucan», descrito allí como el nombre interno de la herramienta de video actual de Gemini basada en Veo 3.1. Si esa ubicación es correcta, Omni podría ser una ruta de reemplazo, una bandera de prueba o el nombre visible de un nuevo pipeline de generación.

Otra posibilidad es que Omni sea realmente un modelo de video nuevo. El texto atribuido a la app dice «Meet our new video model», y Gadgets360 describe Gemini Omni como un modelo que permitiría crear y editar videos directamente dentro de Gemini.

La tercera hipótesis es más ambiciosa: que Omni forme parte de un sistema multimodal más amplio. Algunos recopilatorios especulan con que podría unificar texto, imagen, video y audio —o razonamiento multimodal— bajo una sola arquitectura de Gemini. Es una dirección plausible para un producto de IA, pero sigue siendo especulación en las fuentes disponibles. Google no ha confirmado si «Omni» es un nombre público, un codename interno, una familia de modelos, una capa de interfaz o una arquitectura más amplia.

Límites, costos y acceso: lo que no sabemos

No hay suficientes datos verificados para decir cuánto costaría usar Omni o ejecutarlo. Los reportes disponibles no confirman precio, latencia, cuotas, duración máxima de generación, tamaño del modelo, disponibilidad por API ni requisitos de cómputo.

El mejor punto de comparación sigue siendo Veo, donde Google ya segmenta la familia por costo y rendimiento. Veo 3.1 Lite fue presentado como una opción más barata, por menos de la mitad del costo de Veo 3.1 Fast, manteniendo la misma velocidad. Eso muestra que Google está pensando en la economía de la generación de video, pero no permite concluir si Omni será caro, limitado, exclusivo para usuarios premium o pensado para desarrolladores.

Por ahora, cualquier afirmación de que Omni es lento, costoso, limitado a pruebas internas o restringido a clips cortos debe tratarse como no confirmada salvo que Google o un tester verificable publique pruebas.

Cómo queda frente a Runway, Pika y Sora

Con la evidencia actual no se puede hacer un ranking serio frente a Runway, Pika u OpenAI Sora. Las fuentes disponibles no ofrecen datos comparables de benchmark, y la propia evidencia sobre Omni no basta para evaluar realismo, control creativo, duración, consistencia temporal, sistemas de seguridad o costo.

La comparación defendible es de posicionamiento. Si la copia filtrada de Gemini es precisa, Google estaría intentando competir no solo por calidad de salida, sino por flujo de trabajo: pedir un video desde Gemini, elegir una plantilla, remezclar un clip y editarlo por chat en la misma interfaz. Eso podría diferenciarlo de herramientas de video con IA más independientes, pero no demuestra que Omni supere a Sora, Runway o Pika en calidad visual.

Qué mirar en Google I/O 2026

Las preguntas clave para I/O son bastante concretas:

¿Google anunciará Omni por ese nombre?
¿Será un modelo público nuevo, un sucesor de Veo, una capa de interfaz de Gemini o un codename interno?
¿Habrá ficha técnica, detalles de API, notas de seguridad o precios?
¿Las plantillas, el remix y la edición en chat formarán parte del lanzamiento?
¿Google dará comparaciones verificables con Veo 3.1 en duración, resolución, audio, renderizado de texto y generación desde imágenes?

Hasta que esas respuestas lleguen, la filtración de Omni debe leerse como una señal creíble de hacia dónde podría moverse Google en video con IA, no como una hoja de especificaciones confirmada. La historia, por ahora, está en las cadenas de la app; lo demás todavía necesita que Google lo haga oficial.

Gemini Omni: la pista más clara sobre el próximo modelo de video de Google