Além da velocidade, o Grok Imagine Video 1.5 resolve artefatos visuais que há muito tempo assombravam os vídeos gerados por IA. A versão anterior frequentemente tinha dificuldades com a coerência do movimento, gerando clipes com torções bizarras de membros e objetos "flutuantes" que denunciavam sua origem artificial . O modelo 1.5 corrige grande parte desse comportamento, proporcionando um movimento de personagens e câmera muito mais suave e natural
.
De forma mais sutil, o modelo agora simula leis da física do mundo real com mais nuance, demonstrando uma compreensão aprimorada de peso e impulso. As cenas podem mostrar uma pessoa caminhando com o balanço natural da roupa, ou um objeto caindo seguindo uma curva de aceleração realista. O resultado são vídeos que parecem fisicamente fundamentados, e não montagens digitais artificiais .
A adição estrategicamente mais importante é a introdução da geração de áudio sincronizado de forma nativa, um recurso totalmente ausente na versão anterior . Até então, adicionar som a um clipe do Grok exigia ferramentas externas e uma sincronização manual trabalhosa. A versão 1.5 agora produz o vídeo com o áudio automaticamente sincronizado à ação em tela — sons ambientes, efeitos sonoros e atmosfera são gerados junto com as imagens
. Isso elimina um grande ponto de atrito no processo criativo, permitindo que artistas e criadores de conteúdo produzam uma peça audiovisual completa em uma única etapa
.
O lançamento sucede uma fase de testes de enorme sucesso que começou em 3 de junho de 2026 . Durante este período, o Grok Imagine Video 1.5 rapidamente impôs seu domínio nos comparativos da indústria, alcançando o primeiro lugar no Artificial Analysis Video Arena com um salto expressivo de +52 pontos Elo sobre o modelo 1.0 anterior
. Ele superou concorrentes de peso como o Seedance 2.0 da ByteDance e o Veo do Google, um feito que o CEO Elon Musk promoveu ao compartilhar um trailer gerado por IA da Ilíada que acumulou mais de 18 milhões de visualizações no X (antigo Twitter)
.
Vale lembrar que o Grok Imagine Video 1.5 é diferente do chatbot Grok, embora compartilhem a marca. Trata-se de um modelo dedicado para converter tanto texto quanto imagens em vídeo . Com o fim do período de testes, ele está acessível para desenvolvedores via API da xAI sob o nome de modelo
grok-imagine-video-1.5, e para o público geral através do aplicativo Grok Imagine na web, iOS e Android . Ao integrar o áudio sincronizado diretamente em seu rápido processo de geração, a xAI está apostando em uma experiência criativa completa para definir a próxima fase do competitivo mercado de criação de vídeos por IA
.
Comments
0 comments