Gemini Omni से पहले Google का मुख्य AI वीडियो मॉडल Veo था।
दोनों के बीच सबसे बड़ा अंतर उनका दायरा है।
Veo
Gemini Omni
इसका मतलब है कि Omni उन क्षमताओं को एक ही सिस्टम में लाने की कोशिश करता है जो पहले अलग‑अलग टूल या मॉडल में बंटी हुई थीं, जैसे Veo और अन्य जनरेटिव मीडिया मॉडल।
Omni परिवार का पहला प्रोडक्शन मॉडल Gemini Omni Flash है, जिसे I/O 2026 के दिन ही रोल‑आउट करना शुरू कर दिया गया।
यह एक ही प्रॉम्प्ट में कई तरह के इनपुट ले सकता है:
इन इनपुट के आधार पर AI:
Google के डेमो में ऐसे उदाहरण दिखाए गए जिनमें उपयोगकर्ता टेक्स्ट और इमेज मिलाकर वीडियो सीन बनाते हैं या मौजूदा फुटेज को AI निर्देशों से बदलते हैं।
शुरुआती उपलब्धता इन प्लेटफॉर्म पर है:
Gemini इकोसिस्टम में इसका एक्सेस Google की AI सब्सक्रिप्शन योजनाओं से जुड़ा है।
समर्थित प्लान:
Google ने I/O 2026 में $100 प्रति माह वाला AI Ultra प्लान भी पेश किया, जो खास तौर पर डेवलपर्स और उन्नत क्रिएटर्स के लिए बनाया गया है जिन्हें ज्यादा कंप्यूट संसाधन चाहिए।
नए जनरेटिव टूल्स के साथ Google ने कंटेंट ट्रांसपेरेंसी पर भी जोर दिया। इसके लिए कंपनी अपने SynthID सिस्टम का इस्तेमाल कर रही है।
SynthID एक अदृश्य डिजिटल वॉटरमार्किंग तकनीक है जो AI‑generated कंटेंट में पहचानने योग्य सिग्नल जोड़ती है।
यह तकनीक इन फॉर्मेट में इस्तेमाल हो सकती है:
ये वॉटरमार्क इंसानों को दिखाई नहीं देते, लेकिन सॉफ्टवेयर से पहचान लिए जाते हैं। इससे यह पता लगाना आसान हो जाता है कि कोई कंटेंट AI से बना है या नहीं।
Google I/O 2026 में कंपनी ने SynthID के विस्तार की भी घोषणा की।
Google Search और Chrome ब्राउज़र में नए फीचर जोड़ रहा है जो यह पहचानने में मदद करेंगे कि कोई ऑनलाइन इमेज AI से बनाई गई है या नहीं।
इसका उद्देश्य है कि सामान्य उपयोगकर्ता भी बिना किसी खास टूल के यह जांच सकें कि कोई फोटो असली है, एडिटेड है या पूरी तरह AI‑generated।
Google ने यह भी बताया कि कई अन्य टेक कंपनियाँ SynthID को अपनाने लगी हैं, जैसे:
कंपनी का लक्ष्य है कि यह सिस्टम धीरे‑धीरे AI‑generated मीडिया पहचानने का इंडस्ट्री स्टैंडर्ड बन सके।
Google का SynthID Detector पोर्टल उपयोगकर्ताओं को मीडिया फाइल अपलोड करके यह जांचने की सुविधा देता है कि उसमें SynthID वॉटरमार्क मौजूद है या नहीं। यह पत्रकारों, शोधकर्ताओं और फैक्ट‑चेकर्स के लिए खास उपयोगी माना जा रहा है।
Gemini Omni यह दिखाता है कि AI सिस्टम अब अलग‑अलग टूल्स से आगे बढ़कर एकीकृत मल्टीमॉडल प्लेटफॉर्म बन रहे हैं।
पहले टेक्स्ट, इमेज और वीडियो के लिए अलग‑अलग AI मॉडल होते थे। Omni जैसे सिस्टम का उद्देश्य है कि एक ही मॉडल किसी भी इनपुट से किसी भी प्रकार का आउटपुट बना सके।
अभी इसकी शुरुआत वीडियो से हो रही है, लेकिन Google इसे भविष्य में पूरी तरह मल्टीमॉडल मीडिया जनरेशन सिस्टम के रूप में विकसित करना चाहता है—साथ ही SynthID जैसे टूल्स के जरिए AI कंटेंट की पारदर्शिता बनाए रखने की कोशिश भी जारी है।
Comments
0 comments