Окрім швидкості, Grok Imagine Video 1.5 вирішує проблеми з візуальними артефактами, які довгий час переслідували моделі ШІ-відео. Попередня версія часто погано справлялася з узгодженістю рухів, створюючи кліпи з неприродним викривленням кінцівок та об'єктами, що «пливуть», що видавало їхнє синтетичне походження . Версія 1.5 значною мірою виправляє цю поведінку, забезпечуючи набагато плавніший та природніший рух персонажів і камери
.
Більш тонко, модель тепер моделює фізику реального світу з більшою нюансованістю, демонструючи покращене розуміння ваги та імпульсу. У сценах може бути показано, як людина йде з природним колиханням одягу, або як об'єкт, що падає, рухається реалістичною траєкторією прискорення. В результаті відео виглядають більш фізично обґрунтованими, а не цифровою збіркою .
Найважливішим зі стратегічної точки зору доповненням є поява вбудованої генерації синхронізованого аудіо — функції, яка була повністю відсутня в попередній версії . Раніше додавання звуку до кліпу, створеного Grok, вимагало зовнішніх інструментів і ручної синхронізації. Тепер версія 1.5 створює відео з аудіо, яке автоматично прив'язане до дії на екрані, — фонові шуми, звукові ефекти та атмосфера генеруються разом із візуальним рядом
. Це усуває головну перешкоду в творчому процесі, дозволяючи художникам та творцям контенту створювати завершений аудіовізуальний фрагмент за один крок
.
Запуск відбувся після дуже успішної фази попереднього доступу, яка розпочалася 3 червня 2026 року . За цей період Grok Imagine Video 1.5 швидко закріпила своє домінування в галузевих тестах, піднявшись на перше місце в Artificial Analysis Video Arena зі значним стрибком у +52 бали Elo порівняно зі старішою моделлю 1.0
. Вона перевершила таких важковаговиків, як Seedance 2.0 від ByteDance та Veo від Google. Генеральний директор Ілон Маск просував цей успіх, поділившись створеним ШІ трейлером до «Іліади», який набрав понад 18 мільйонів переглядів у соцмережі X
.
Grok Imagine Video 1.5 — це не чат-бот Grok, хоча вони мають спільний бренд. Це спеціалізована модель для перетворення тексту та зображень у відео . Після завершення періоду попереднього доступу вона доступна розробникам через API xAI під назвою моделі
grok-imagine-video-1.5, а звичайним користувачам — через застосунок Grok Imagine в інтернеті, на iOS та Android . Інтегруючи синхронізоване аудіо безпосередньо у свій швидкий конвеєр генерації, xAI робить ставку на універсальний досвід створення контенту, щоб визначити наступний етап у конкурентному ландшафті генеративного відео з ШІ
.
Comments
0 comments