Ein weiterer Bericht verweist auf zusätzlichen Text aus der Gemini-Mobile-App: „Meet our new video model. Remix your videos, edit directly in chat, try a template, and more.“ Falls dieser Text stimmt, wäre Omni nicht nur ein interner Modellname, sondern eher eine Produktoberfläche zum Erstellen, Remixen und Bearbeiten von Videos direkt in Gemini.
Daneben gibt es Berichte über frühe Demos und viral geteilte Clips. Gadgets360 schreibt, frühe Demos hätten realistischere Bewegungen, sauberere Textdarstellung und bessere Szenenkomposition gezeigt. Eine nutzergenerierte YouTube-Diskussion beschreibt zudem zwei auf X kursierende Clips, deren Metadaten angeblich auf „Google Gemini Omni Mode“ verweisen. Diese Clips sind aber deutlich schwächeres Material als die UI-Texte: Google hat Omni in den vorliegenden Quellen nicht offiziell angekündigt, und die Clips sind nicht unabhängig als Omni-Ausgaben verifiziert.
Wenn die gemeldeten Gemini-Texte korrekt sind, zeigen sie vor allem auf vier mögliche Nutzerfunktionen:
Genau darin liegt der bisher greifbare Produktkern. Nicht belegt sind dagegen Dinge wie Videolänge, Auflösung, API-Zugang, Prompt-Limits, Generierungsgeschwindigkeit, Audioqualität, Sicherheitsmechanismen oder Preise.
Veo 3.1 ist derzeit die bestätigte Messlatte. Google veröffentlichte Veo 3.1 und Veo 3.1 Fast als kostenpflichtige Preview über die Gemini API, Google AI Studio und Vertex AI; außerdem wurden die Modelle laut Google in der Gemini-App und in Flow verfügbar. Google beschrieb Veo 3.1 als Update mit reichhaltigerem nativem Audio, mehr narrativer Kontrolle und verbesserten Ergebnissen bei der Generierung von Videos aus Bildern.
Google hat die Veo-3.1-Familie weiter ausgebaut. Im Januar 2026 erklärte der Konzern, Veo 3.1 könne aus Bildern ausdrucksstärkere Videos erzeugen, vertikale Videos für Plattformen wie YouTube Shorts erstellen und in Produkten wie Gemini, Flow, der Gemini API, Vertex AI und Google Vids auf 1080p oder 4K hochskalieren. Im März 2026 führte Google Veo 3.1 Lite als kostengünstigstes Videomodell ein; es koste weniger als 50 Prozent von Veo 3.1 Fast und laufe zugleich mit derselben Geschwindigkeit.
Vor diesem offiziellen Veo-Hintergrund beweist der Omni-Leak keinen einfachen „bessere Specs“-Sprung. Der klarste Unterschied wäre der Workflow: Templates, Bearbeitung im Chat und Remixing direkt in Gemini. Berichte über bessere Bewegung, saubereren Text oder stärkere Komposition können sich als richtig erweisen – derzeit fehlen dafür aber eine Google-Modellkarte, Benchmarks oder reproduzierbare öffentliche Tests.
Alle drei Deutungen bleiben offen.
Erstens könnte Omni ein neuer Name für einen bestehenden oder verbesserten Gemini-Videozweig sein. WaveSpeed berichtet, der „Powered by Omni“-Text sei in der Nähe von „Toucan“ erschienen; „Toucan“ wird dort als interner Name für das aktuelle, von Veo 3.1 angetriebene Gemini-Videowerkzeug beschrieben. Wenn diese Einordnung stimmt, könnte Omni ein Ersatzpfad, ein Test-Flag oder ein UI-Name für eine neue Generierungspipeline sein.
Zweitens könnte Omni tatsächlich ein neues Videomodell sein. Der gemeldete App-Text spricht von „our new video model“, und Gadgets360 beschreibt Gemini Omni als Modell, mit dem Nutzerinnen und Nutzer Videos direkt in Gemini erstellen und bearbeiten könnten.
Drittens wird Omni in einigen Leak-Zusammenfassungen als Teil eines größeren multimodalen Systems gedeutet – also als Architektur, die Text, Bild, Video und Audio stärker zusammenführt. Das passt zwar zu einer möglichen Produktstrategie, bleibt in den vorliegenden Quellen aber Spekulation. Google hat nicht bestätigt, ob „Omni“ ein öffentlicher Produktname, ein interner Codename, eine Modellfamilie, eine UI-Schicht oder eine breitere Architektur ist.
Zu wenig. Die vorliegenden Berichte bestätigen keine Preise, Latenzen, Kontingente, Videolängen, Modellgrößen, API-Verfügbarkeit oder Rechenanforderungen von Omni.
Der sinnvollste Vergleichspunkt ist Veo, weil Google dort bereits sichtbar nach Kosten und Leistung segmentiert. Veo 3.1 Lite wurde als günstigere Option vorgestellt – mit weniger als der Hälfte der Kosten von Veo 3.1 Fast bei gleicher Geschwindigkeit. Das zeigt, dass Google die Ökonomie von Videogenerierung im Blick hat. Es sagt aber nichts darüber aus, ob Omni teuer, limitiert, nur für Premium-Nutzer verfügbar oder für Entwickler gedacht sein wird.
Behauptungen, Omni sei langsam, kostspielig, auf kurze Clips beschränkt oder nur internen Testern zugänglich, sollten deshalb als unbestätigt gelten, solange Google oder verifizierbare Tester keine belastbaren Nachweise veröffentlichen.
Ein seriöses Kopf-an-Kopf-Ranking ist aus der aktuellen Beweislage nicht möglich. Die bereitgestellten Quellen enthalten keine vergleichbaren Benchmarks zu Runway, Pika oder OpenAI Sora; außerdem reicht der Omni-Leak selbst nicht aus, um Realismus, Steuerbarkeit, Clip-Länge, zeitliche Konsistenz, Sicherheitsfunktionen oder Kosten zu bewerten.
Was man vorsichtig sagen kann, betrifft die Positionierung. Falls die geleakten Gemini-Texte stimmen, könnte Google nicht nur über reine Videoqualität konkurrieren, sondern über einen integrierten Arbeitsablauf: in Gemini prompten, eine Vorlage wählen, einen Clip remixen und Änderungen im Chat anweisen – alles in derselben Oberfläche. Das wäre gegenüber eigenständigen KI-Videotools ein relevanter Unterschied. Es beweist aber nicht, dass Omni bei der Ausgabequalität besser ist als Sora, Runway oder Pika.
Die wichtigsten Fragen für die I/O sind deshalb ziemlich klar:
Bis diese Antworten vorliegen, sollte der Gemini-Omni-Leak als glaubwürdiges Signal für Googles mögliche Videorichtung gelesen werden – nicht als bestätigtes Datenblatt. Die UI-Strings sind die eigentliche Nachricht. Alles andere wartet noch darauf, von Google offiziell gemacht zu werden.
Comments
0 comments