從已報道嘅文案睇,Omni 最明顯指向幾個用戶層面功能:
Veo 3.1 係目前可以確認嘅 Google 影片模型基準。Google 已經將 Veo 3.1 同 Veo 3.1 Fast 以 paid preview 形式放入 Gemini API、Google AI Studio 同 Vertex AI,並表示 Veo 3.1 亦可在 Gemini app 同 Flow 使用;Google 當時形容 Veo 3.1 有更豐富原生音訊、更強敘事控制,以及由圖片生成影片時有更好輸出。
Google 之後亦繼續擴展 Veo 3.1 系列。2026 年 1 月,Google 表示 Veo 3.1 可由圖片建立更有表現力嘅影片,支援適合 YouTube Shorts 等平台嘅直向影片,並可在 Gemini、Flow、Gemini API、Vertex AI、Google Vids 等產品中升頻至 1080p 或 4K。 到 2026 年 3 月,Google 又推出 Veo 3.1 Lite,稱它是成本最低嘅影片模型,成本低於 Veo 3.1 Fast 一半,同時速度相同。
所以,將 Omni 同 Veo 3.1 比,暫時唔應該講成「規格全面升級」。最清楚嘅差異其實係工作流:模板、聊天內編輯、remix,以及喺 Gemini 入面一站式完成影片創作。 至於動作更真實、文字更清楚、構圖更好等說法,可能最後會成立,但現階段未有 Google 模型卡、官方 benchmark 或可重複公開測試支持。
暫時三個可能性都未可以排除。
第一,Omni 可能只係現有 Gemini 影片路徑嘅新名字,或者某個升級版流程。WaveSpeed 報道指 「Powered by Omni」 字串出現在 Toucan 附近,而 Toucan 被形容為 Gemini 目前由 Veo 3.1 驅動嘅影片工具內部名稱。 如果呢個位置判讀正確,Omni 可能係替代路徑、測試 flag,或者新一代生成 pipeline 嘅 UI 名稱。
第二,Omni 亦可能係真正全新影片模型。因為報道中嘅 app 文案寫住 「Meet our new video model」,而 Gadgets360 亦形容 Gemini Omni 可能讓用戶直接在 Gemini 內建立同編輯影片。
第三,Omni 可能係更大嘅多模態系統一部分。有 leak roundup 推測 Omni 可能把文字、圖片、影片、音訊生成或推理統一到單一 Gemini 架構之下。 呢個方向合理,但仍然係推測;Google 未確認 Omni 是公開產品名、內部代號、模型家族、UI 層,定係更大嘅多模態架構。
現階段冇足夠可核實證據,可以講 Omni 要幾多成本、幾快、可生成幾長、會唔會限額、模型幾大,或者會唔會開 API。現有報道未確認 Omni 定價、延遲、quota、生成長度、模型規模、API 可用性或算力需求。
最好嘅參考仍然係 Veo 系列,因為 Google 已經明確用成本同效能去分層。Veo 3.1 Lite 被定位為低成本選項,成本低於 Veo 3.1 Fast 一半而速度相同。 這說明 Google 明顯在意 AI 影片生成嘅經濟性,但唔代表 Omni 一定昂貴、只限高級用戶、只限內部測試,或者只支援短片。
換言之,凡係聲稱 Omni 已被 tester 發現好慢、好貴、只限短片、只限內部員工使用,都應該先當成未證實,除非 Google 或可核實測試者公開更實在證據。
而家未有足夠資料做負責任嘅頭對頭排名。提供嘅來源入面,冇 Runway、Pika 或 OpenAI Sora 同 Omni 之間可比較 benchmark;而 Omni 本身嘅證據亦未足以評估真實感、可控性、片長、時間一致性、安全系統或者成本。
唯一可以比較嘅,是產品定位。如果外洩 Gemini 文案準確,Google 可能唔只係想鬥影片質素,而係想鬥工作流:在 Gemini 入面輸入想法、揀模板、remix 片段,再用聊天方式逐步修改同完成輸出。 呢一點對獨立 AI 影片工具會係有意思嘅差異,但並唔等於 Omni 已經在畫質、穩定性或者控制力上贏過 Sora、Runway 或 Pika。
到時最值得留意五件事:
在 Google 正式開口之前,Gemini Omni 最合理嘅定位係:一個可信嘅產品方向訊號,而唔係一張已確認規格表。今次真正有價值嘅線索係 app 字串;其餘一切,仍然要等 Google 將它變成真正產品。
Comments
0 comments