喺 Gemini Omni 之前,Google 嘅主要影片生成模型係 Veo。
兩者最大分別係設計定位。
Veo:
Gemini Omni:
Gemini Omni Flash 係 Omni 系列第一個正式推出嘅模型。
佢支援喺 同一個提示(prompt)入面混合多種輸入:
Google 示範過幾個典型用法,例如:
首批支援平台包括:
喺 Gemini 生態入面,Omni 功能同 Google AI 訂閱計劃綁定。
支援方案包括:
隨住生成式 AI 越來越強,Google 亦同步推動 內容透明度工具。
核心技術叫 SynthID。
SynthID 係一種 隱形數碼水印技術,會嵌入喺 AI 生成內容入面,包括:
喺 I/O 2026,Google 宣布幾項重要擴展。
Google 亦宣布多間科技公司開始使用 SynthID,例如:
Google 仲推出 SynthID Detector 網站工具。
Gemini Omni 代表 AI 媒體生成方向嘅一個重大轉變。
過去 AI 工具通常分開:
Google 而家嘅策略係建立 統一多模態模型,一個系統同時理解同生成唔同媒體。
目前第一步係 多輸入生成影片,但長遠目標係:
任何輸入 → 任何輸出。
同時,Google 亦將呢類生成能力同 **水印同檢測系統(SynthID)**配合,希望減低 AI 假內容同 deepfake 帶來嘅風險。
Comments
0 comments