O Google também afirma que o modelo foi projetado para lidar melhor com movimento, física e interação entre objetos, o que ajuda a tornar os vídeos gerados mais realistas.
Embora o lançamento inicial seja focado em vídeo, a empresa diz que versões futuras do Omni poderão gerar outras modalidades de saída, como imagens ou texto, a partir de entradas multimodais.
Antes do Omni, o principal sistema de geração de vídeo do Google era o Veo, um modelo dedicado exclusivamente a vídeos.
A principal diferença está na arquitetura e no escopo.
Veo
Gemini Omni
Em vez de vários modelos independentes para cada tipo de mídia, o Omni funciona como um modelo base único, que combina capacidades antes distribuídas entre sistemas como Veo e outros modelos criativos.
A ideia é que a IA entenda melhor o contexto entre diferentes formatos — por exemplo, combinar diálogo, imagens de referência e clipes de vídeo na mesma criação.
O Gemini Omni Flash é o primeiro modelo disponível da nova família.
Ele aceita múltiplos tipos de entrada em um único prompt, incluindo:
A partir disso, o sistema gera vídeos realistas e permite editar os resultados de forma interativa por meio de conversa.
Alguns exemplos de uso demonstrados pelo Google incluem:
Segundo a empresa, o modelo foi treinado para compreender melhor movimento, gravidade e interações físicas, o que ajuda a produzir vídeos mais consistentes em termos de simulação do mundo real.
As primeiras plataformas com acesso incluem:
No ecossistema Gemini, o acesso está vinculado aos planos pagos de IA do Google.
Entre eles:
Durante o evento, o Google também apresentou um plano AI Ultra de US$100 por mês, voltado para desenvolvedores e criadores que precisam de maior capacidade de computação e uso dentro da plataforma Gemini.
Junto com as novas ferramentas de geração, o Google destacou mecanismos de transparência baseados no SynthID.
O SynthID é uma tecnologia de marca d’água invisível que incorpora sinais identificáveis em conteúdos criados por IA, incluindo:
Esses sinais não são perceptíveis para humanos, mas podem ser detectados por software para verificar a origem do conteúdo.
No I/O 2026, o Google anunciou várias expansões desse sistema.
Ferramentas de verificação estão sendo integradas ao Google Search e ao navegador Chrome, permitindo identificar quando imagens online foram geradas ou alteradas com IA.
O Google também revelou que várias companhias passaram a adotar o SynthID em seus próprios sistemas de IA, incluindo:
A intenção é ampliar o uso da tecnologia como um padrão de identificação de mídia gerada por IA na internet.
O portal SynthID Detector permite enviar arquivos de mídia e verificar se eles contêm a marca d’água do sistema, ajudando jornalistas, pesquisadores e plataformas a confirmar a origem do conteúdo.
O Gemini Omni representa uma mudança na forma como modelos de IA generativa estão sendo construídos.
Em vez de ferramentas separadas para texto, imagem e vídeo, o Google está avançando para modelos multimodais unificados, capazes de interpretar e gerar diferentes formatos dentro de um único fluxo de trabalho.
A geração de vídeo a partir de múltiplos inputs é apenas o primeiro passo. A visão mais ampla do Google é criar um sistema capaz de gerar qualquer tipo de conteúdo a partir de qualquer tipo de entrada, combinando raciocínio, criatividade e compreensão do mundo em um único modelo.
Ao mesmo tempo, a empresa tenta equilibrar esse avanço com ferramentas de transparência como o SynthID, voltadas para lidar com desafios crescentes como desinformação e deepfakes.
Comments
0 comments