गति के अलावा, Grok Imagine Video 1.5 उन विज़ुअल आर्टिफैक्ट्स से भी निपटता है जो लंबे समय से AI वीडियो मॉडल को परेशान करते रहे हैं। पिछले वर्ज़न में अक्सर मोशन कोहेरेंस की समस्या होती थी, जिससे अप्राकृतिक अंगों का मुड़ना और "तैरती" हुई वस्तुएं जैसे क्लिप तैयार होते थे, जो उनके सिंथेटिक मूल को उजागर कर देते थे । 1.5 मॉडल इस व्यवहार को काफ़ी हद तक सही करता है, और अधिक सहज और प्राकृतिक किरदार और कैमरा मूवमेंट प्रदान करता है
।
इससे भी सूक्ष्म रूप से, मॉडल अब अधिक बारीकी से वास्तविक दुनिया की भौतिकी (फिजिक्स) का अनुकरण करता है, और वजन व गति (मोमेंटम) की बेहतर समझ प्रदर्शित करता है। दृश्य अब एक व्यक्ति के चलने पर उसके कपड़ों की प्राकृतिक हलचल, या गिरती हुई वस्तु के वास्तविक त्वरण पथ को दर्शा सकते हैं, जिसके परिणामस्वरूप ऐसे वीडियो बनते हैं जो डिजिटल रूप से जुड़े होने के बजाय भौतिक रूप से जमीन से जुड़े हुए महसूस होते हैं ।
सबसे रणनीतिक रूप से महत्वपूर्ण जोड़ बिल्ट-इन सिंक्रोनाइज़्ड ऑडियो जनरेशन की शुरुआत है, एक ऐसा फीचर जो पिछले संस्करण से पूरी तरह अनुपस्थित था । पहले, Grok-जनित क्लिप में ध्वनि जोड़ने के लिए बाहरी टूल्स और मैन्युअल सिंकिंग की आवश्यकता होती थी। वर्ज़न 1.5 अब ऐसे वीडियो तैयार करता है जिनका ऑडियो अपने आप ऑन-स्क्रीन एक्शन से लॉक होता है—परिवेशी ध्वनियां, ध्वनि प्रभाव (साउंड इफेक्ट्स), और वातावरणीय आवाज़ें विज़ुअल्स के साथ-साथ उत्पन्न होती हैं
। यह क्रिएटिव पाइपलाइन में एक बड़े अवरोध को समाप्त करता है, और कलाकारों व कंटेंट क्रिएटर्स को एक ही चरण में एक पूर्ण श्रव्य-दृश्य (ऑडियो-विज़ुअल) खंड तैयार करने की अनुमति देता है
।
यह लॉन्च 3 जून 2026 को शुरू हुए एक अत्यधिक सफल प्रीव्यू चरण के बाद हुआ है । इस अवधि के दौरान, Grok Imagine Video 1.5 ने इंडस्ट्री बेंचमार्क पर तेज़ी से अपना दबदबा कायम किया, और पुराने 1.0 मॉडल पर +52 Elo पॉइंट की भारी छलांग के साथ आर्टिफिशियल एनालिसिस वीडियो एरिना पर #1 स्थान पर चढ़ गया
। इसने बाइटडांस के Seedance 2.0 और गूगल के Veo सहित दिग्गज प्रतिस्पर्धियों को पीछे छोड़ दिया, एक उपलब्धि जिसे CEO एलन मस्क ने द इलियड के AI-जनित ट्रेलर को साझा करके प्रमोट किया, जिसने X पर 18 मिलियन से अधिक बार देखा गया
।
Grok Imagine Video 1.5, Grok चैटबॉट से अलग है, हालाँकि दोनों एक ही ब्रांड साझा करते हैं। यह टेक्स्ट और इमेज दोनों को वीडियो में बदलने के लिए एक समर्पित मॉडल है । प्रीव्यू अवधि समाप्त होने के साथ, यह डेवलपर्स के लिए xAI API पर मॉडल नाम
grok-imagine-video-1.5 के माध्यम से और आम उपयोगकर्ताओं के लिए वेब, iOS और Android पर Grok Imagine ऐप के जरिए सुलभ है । सिंक्रोनाइज़्ड ऑडियो को सीधे अपनी तेज़ जनरेशन पाइपलाइन में शामिल करके, xAI एक ऑल-इन-वन निर्माण अनुभव पर दांव लगा रहा है, ताकि प्रतिस्पर्धी AI वीडियो जनरेशन परिदृश्य के अगले चरण को परिभाषित किया जा सके
।
Comments
0 comments