La gran diferencia con el uso anterior de Gemini es el contexto. Antes, pedir una imagen era una acción aislada. Ahora, en Live, la creación y edición son parte de una conversación continua donde la IA entiende lo que ve y lo que le pides en el mismo hilo de diálogo .
Esta función no es un experimento aislado. Fue presentada en el Google I/O 2026 junto a otras grandes novedades que muestran la estrategia global de Google :
Gemini Omni: "Nano Banana para videos"
Google presentó su nuevo modelo que puede crear y editar videos de forma conversacional. Piensa en ello como la misma experiencia de Live, pero para clips de video. Combina texto, imágenes, audio y video como entrada, y entiende la física del mundo real para hacer ediciones coherentes .
Gemini 3.5 Flash: Velocidad y agencia
Se convirtió en el nuevo modelo por defecto de la app de Gemini y el buscador. Está diseñado para ser rapidísimo (genera tokens cuatro veces más rápido que otros modelos de su categoría) y manejar tareas complejas y "agentes" (multi-paso, programación, flujos de trabajo largos) sin atascarse .
Otras claves del I/O 2026:
Con Gemini Live, Google cierra el círculo entre mostrarle algo a la IA y pedirle que cree o modifique algo nuevo en tiempo real . Pero la visión es más grande: con Gemini Omni para video, la compañía quiere que esa misma fluidez conversacional aplique para la creación y edición de clips complejos
.
La posición de Google en el panorama competitivo de la IA multimodal no es solo tener el mejor modelo de imagen o video por separado. Es la profundidad de la integración: unir la conversación, la cámara, la generación de imagen y la futura creación de video en un solo flujo de trabajo unificado, potenciado por su conocimiento del mundo real. La gran incógnita, como con toda tecnología que recién se despliega, será comprobar qué tan bien funcionan estas ambiciosas integraciones en el día a día de los usuarios .
Comments
0 comments