Di luar kelajuan, Grok Imagine Video 1.5 menangani artifak visual yang telah lama membelenggu model video AI. Versi sebelumnya sering bergelut dengan keselarasan pergerakan, menghasilkan klip dengan anggota badan yang berputar secara tidak semula jadi dan objek "terapung" yang menampakkan asal-usul sintetiknya . Model 1.5 membetulkan banyak daripada isu ini, memberikan pergerakan watak dan kamera yang jauh lebih lancar dan semula jadi
.
Secara lebih halus, model ini kini mensimulasikan fizik dunia sebenar dengan lebih bernuansa, menunjukkan pemahaman yang lebih baik tentang berat dan momentum. Babak boleh menggambarkan seseorang berjalan dengan ayunan pakaian yang semula jadi, atau objek yang jatuh mengikut lengkungan pecutan yang realistik, menghasilkan video yang terasa kukuh secara fizikal dan bukannya seperti dipasang secara digital .
Penambahan yang paling strategik penting ialah pengenalan penjanaan audio segerak terbina, satu ciri yang tiada langsung dalam lelaran sebelumnya . Sebelum ini, menambah bunyi pada klip yang dijana Grok memerlukan alat luaran dan penyelarasan manual. Versi 1.5 kini menghasilkan video dengan audio yang dikunci secara automatik dengan aksi pada skrin—bunyi persekitaran, kesan bunyi, dan suasana dijana bersama visual
. Ini menghapuskan satu titik geseran utama dalam saluran kerja kreatif, membolehkan artis dan pencipta kandungan menghasilkan satu segmen audiovisual lengkap dalam satu langkah
.
Pelancaran ini susulan fasa pratonton yang sangat berjaya yang bermula pada 3 Jun 2026 . Dalam tempoh ini, Grok Imagine Video 1.5 dengan pantas menegaskan dominasinya pada penanda aras industri, melonjak ke tempat #1 di Artificial Analysis Video Arena dengan lonjakan besar sebanyak +52 mata Elo berbanding model 1.0 yang lama
. Ia mengatasi pesaing hebat termasuk Seedance 2.0 (ByteDance) dan Veo (Google), satu pencapaian yang dipromosikan oleh CEO Elon Musk dengan berkongsi treler janaan AI untuk The Iliad yang meraih lebih 18 juta tontonan di X
.
Grok Imagine Video 1.5 adalah berbeza daripada chatbot Grok, walaupun mereka berkongsi jenama. Ia adalah model khusus untuk menukar kedua-dua teks dan imej kepada video . Dengan tamatnya tempoh pratonton, ia boleh diakses oleh pembangun melalui API xAI di bawah nama model
grok-imagine-video-1.5 dan kepada pengguna umum melalui aplikasi Grok Imagine di web, iOS, dan Android . Dengan menggabungkan audio segerak terus ke dalam saluran penjanaan pantasnya, xAI mempertaruhkan pengalaman penciptaan semua-dalam-satu untuk mentakrifkan fasa seterusnya dalam landskap persaingan penjanaan video AI
.
Comments
0 comments