Neben der Geschwindigkeit räumt Grok Imagine Video 1.5 mit visuellen Artefakten auf, die KI-Videomodelle lange plagten. Die Vorgängerversion hatte oft mit Bewegungskohärenz zu kämpfen und produzierte Clips mit unnatürlich verdrehten Gliedmaßen und „schwebenden“ Objekten, die ihre synthetische Herkunft verrieten . Das 1.5-Modell korrigiert dieses Verhalten weitgehend und liefert deutlich geschmeidigere, natürlichere Bewegungen von Charakteren und Kamera
.
Feiner, aber ebenso bedeutsam: Das Modell simuliert nun reale Physik mit mehr Nuancen und zeigt ein verbessertes Verständnis für Gewicht und Momentum. Szenen können eine gehende Person darstellen, deren Kleidung natürlich mitschwingt, oder ein fallendes Objekt, das einer realistischen Beschleunigungskurve folgt – was zu Videos führt, die sich physisch verankert anfühlen, statt digital zusammengebastelt .
Die strategisch wichtigste Neuerung ist die Einführung der integrierten, synchronen Audiogenerierung, ein Feature, das beim Vorgänger komplett fehlte . Musste man früher Ton mithilfe externer Werkzeuge manuell an einen Grok-Clip anlegen, produziert Version 1.5 nun Videos mit automatisch auf das Bildgeschehen abgestimmten Ton – Umgebungsgeräusche, Soundeffekte und Atmosphäre werden parallel zu den Bildern generiert
. Das beseitigt einen großen Reibungspunkt in der kreativen Pipeline und ermöglicht es Künstlern und Content-Erstellern, ein vollständiges audiovisuelles Segment in einem Schritt zu produzieren
.
Der Marktstart folgt auf eine äußerst erfolgreiche Vorschauphase, die am 3. Juni 2026 begann . In dieser Zeit behauptete Grok Imagine Video 1.5 rasch seine Dominanz in Branchen-Benchmarks und kletterte mit einem satten +52 Elo-Punkte-Sprung gegenüber dem älteren 1.0-Modell auf Platz 1 der Artificial Analysis Video Arena
. Es überflügelte Schwergewichte wie ByteDances Seedance 2.0 und Googles Veo – eine Leistung, die CEO Elon Musk promotete, indem er einen KI-generierten Trailer zu Die Ilias teilte, der über 18 Millionen Views auf X erzielte
.
Grok Imagine Video 1.5 ist vom Grok-Chatbot zu unterscheiden, auch wenn sie sich eine Marke teilen. Es ist ein dediziertes Modell, um sowohl Text als auch Bilder in Videos umzuwandeln . Mit dem Ende der Vorschauphase ist es für Entwickler über die xAI-API unter dem Modellnamen
grok-imagine-video-1.5 und für Endnutzer über die Grok Imagine App im Web, auf iOS und Android zugänglich . Indem xAI synchronisierten Ton direkt in seine schnelle Generierungspipeline einwebt, setzt das Unternehmen auf ein All-in-One-Kreationserlebnis, um die nächste Phase im hart umkämpften Markt der KI-Videogenerierung zu definieren
.
Comments
0 comments