Más allá de la velocidad, Grok Imagine Video 1.5 aborda los artefactos visuales que han plagado durante mucho tiempo a los modelos de video con IA. La versión anterior a menudo tenía dificultades con la coherencia del movimiento, produciendo clips con torsiones antinaturales de extremidades y objetos "flotantes" que delataban su origen sintético . El modelo 1.5 corrige gran parte de este comportamiento, ofreciendo un movimiento de personajes y cámara significativamente más suave y natural
.
De forma más sutil, el modelo ahora simula las leyes de la física del mundo real con mayores matices, demostrando una comprensión mejorada del peso y el momento. Las escenas pueden mostrar a una persona caminando con un vaivén natural de su ropa, o un objeto cayendo siguiendo una curva de aceleración realista, resultando en videos que se sienten físicamente sólidos en lugar de montajes digitales .
La adición estratégicamente más importante es la introducción de la generación de audio sincronizado integrada, una característica completamente ausente en la iteración anterior . Antes, añadir sonido a un clip generado por Grok requería herramientas externas y sincronización manual. La versión 1.5 ahora produce videos con audio que se ajusta automáticamente a la acción en pantalla: sonidos ambientales, efectos de sonido y atmósfera se generan junto con las imágenes
. Esto elimina un importante punto de fricción en el proceso creativo, permitiendo a artistas y creadores de contenido producir un segmento audiovisual completo en un solo paso
.
El lanzamiento sigue a una exitosa fase de vista previa que comenzó el 3 de junio de 2026 . Durante este período, Grok Imagine Video 1.5 afirmó rápidamente su dominio en los benchmarks de la industria, escalando al puesto número 1 en el Artificial Analysis Video Arena con un sustancial salto de +52 puntos Elo sobre el modelo 1.0 más antiguo
. Superó a competidores de peso como Seedance 2.0 de ByteDance y Veo de Google, una hazaña que el CEO Elon Musk promocionó compartiendo un tráiler generado por IA para La Ilíada que acumuló más de 18 millones de visualizaciones en X
.
Grok Imagine Video 1.5 es distinto del chatbot Grok, aunque compartan marca. Es un modelo dedicado a convertir tanto texto como imágenes en video . Con el período de vista previa ya finalizado, los desarrolladores pueden acceder a él a través de la API de xAI bajo el nombre de modelo
grok-imagine-video-1.5, y los usuarios generales mediante la aplicación Grok Imagine en la web, iOS y Android . Al integrar el audio sincronizado directamente en su rápida línea de generación, xAI apuesta por una experiencia de creación todo en uno para definir la próxima fase del competitivo panorama de la generación de video por IA
.
Comments
0 comments