在 Gemini Omni 之前,谷歌的视频生成主要依赖 Veo。
两者最大的差异在于定位和架构。
Veo
Gemini Omni
这意味着用户可以在同一次生成中同时提供:
它支持在同一个提示中输入:
谷歌展示的一些典型使用方式包括:
首批上线的平台包括:
在 Gemini 生态中,Omni 功能与谷歌的 AI 订阅体系绑定。
目前支持的订阅层级包括:
随着生成式视频能力增强,谷歌同时强调 AI 内容透明度与防伪机制。
核心技术是 SynthID。
SynthID 是一种 不可见数字水印技术,可以嵌入到 AI 生成内容中,包括:
在 I/O 2026 上,谷歌宣布多项扩展。
新的检测功能将进入:
谷歌还宣布多家公司开始采用 SynthID,包括:
谷歌提供了 SynthID Detector 检测门户。
这对 媒体机构、研究人员和事实核查团队尤其重要。
Gemini Omni 代表着 AI 模型架构的一次重要变化。
过去,生成式 AI 往往是分开的系统:
而谷歌现在正在推动 统一多模态模型:
一个系统即可理解并生成不同类型的内容。
当前阶段,Omni 主要专注于 从多模态输入生成视频。
与此同时,谷歌通过 SynthID 等技术尝试建立 AI 内容溯源与识别机制,以应对深度伪造和生成式媒体带来的挑战。
Comments
0 comments