उत्तरप्रकाशित2 माह पहलेLast edited पिछला माह28 स्रोत

गूगल जेमिनी ओमनी फ्लैश: एआई वीडियो मॉडल जो बातचीत की तरह एडिट करता है

गूगल ने 19 मई, 2026 को जेमिनी ओमनी फ्लैश लॉन्च किया, एक मल्टी मॉडल एआई मॉडल जो टेक्स्ट, इमेज, ऑडियो और वीडियो के मिश्रण से 10 सेकंड के वॉटरमार्क वीडियो क्लिप बनाता है, और उपयोगकर्ताओं को लगातार बातचीत के माध्यम से आउट... लाइका ने सार्वजनिक रूप से कहा है कि जेमिनी ओमनी जैसे जनरेटिव एआई उपकरण उसके क्लासिक कैमरों के लि...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

Abstract visualization of Google's Gemini Omni Flash multimodal AI model combining video, audio, image, and text inputs — What is Google's Gemini Omni Flash AI video editing model, how does it work and who can access it, what is Leica's position on generative AIGoogle DeepMind's new Gemini Omni Flash model generates and edits video from any combination of text, image, audio, and existing video inputs.
AI संकेत
Create a landscape editorial hero image for this Studio Global article: What is Google's Gemini Omni Flash AI video editing model, how does it work and who can access it, what is Leica's position on generative AI. Article summary: Here is a full breakdown covering all four parts of your question.. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Gemini Omni is a new family of AI models meant to ‘create anything’. Google is announcing a major new family of generative AI models that it calls Gemini Omni. The company is pos" source context "Gemini Omni is a new family of AI models meant to 'create anything'" Reference image 2: visual subject "# Gemini Omni is a new family of AI models meant to ‘create anything’. Google is announcing a major new family of generative AI models that it calls Gemini Omni. The
openai.com

गूगल ने अभी-अभी एक नया एआई मॉडल जारी किया है जो सिर्फ वीडियो नहीं बनाता — बल्कि यह ऐसे संपादन करता है जैसे आप किसी मानव संपादक से बात कर रहे हों। 19 मई, 2026 को गूगल आई/ओ में घोषित, जेमिनी ओमनी फ्लैश नई जेमिनी ओमनी फैमिली का पहला सार्वजनिक मॉडल है, और यह इस बात का प्रतीक है कि गूगल जनरेटिव मीडिया के बारे में कैसे सोचता है, इसमें एक बड़ा बदलाव आया है । एक स्टैंडअलोन टूल होने के बजाय, यह गूगल की वीडियो जनरेशन क्षमताओं को सीधे उसके मुख्य जेमिनी रीजनिंग सिस्टम में जोड़ता है ।

इसकी मुख्य पेशकश है "कुछ भी इनपुट करो, वीडियो आउटपुट पाओ" । पिछले मॉडलों के विपरीत, जिनमें बार-बार मेहनत वाले प्रॉम्प्ट की आवश्यकता होती थी, ओमनी फ्लैश याद रखता है कि उसने पहले क्या बनाया है। आप इसे किसी किरदार की जैकेट बदलने, लाइटिंग बदलने, या किसी सीन को फिर से लिखने के लिए कह सकते हैं, और यह क्लिप के बाकी लेआउट और कंसिस्टेंसी को बनाए रखेगा । यह मल्टी-टर्न, बातचीत-आधारित संपादन ही वह खास फीचर है जो इसे एक-बार के वीडियो टूल्स की पीढ़ी से अलग करता है ।

जेमिनी ओमनी फ्लैश कैसे काम करता है

जेमिनी ओमनी फ्लैश कोई सामान्य इमेज जोड़ने वाला टूल नहीं है। इसकी अंतर्निहित आर्किटेक्चर एक ट्रांसफॉर्मर-आधारित मॉडल है जो एक एकल, सुसंगत आउटपुट उत्पन्न करने के लिए टेक्स्ट, इमेज, ऑडियो और वीडियो इनपुट के किसी भी संयोजन पर तर्क करता है । गूगल का तर्क है कि इससे मॉडल को एक प्रकार की "विश्व-आधारित" बुद्धिमत्ता मिलती है, जिसका अर्थ है कि यह जनरेटेड सीन को विश्वसनीय बनाए रखने के लिए भौतिकी, गतिकी, इतिहास और सांस्कृतिक संदर्भ के नियमों को लागू करता है ।

यह जेमिनी के तर्क इंजन को वीओ (Veo), नैनो बनाना (Nano Banana), और जिनी (Genie) जैसे सिद्ध जनरेटिव मीडिया मॉडलों के साथ जोड़ता है । परिणाम एक ऐसी प्रणाली है जो एक साथ टेक्स्ट प्रॉम्प्ट, एक संदर्भ छवि, एक ऑडियो सैंपल और एक मौजूदा वीडियो क्लिप ले सकती है, और उन्हें सिंक्रोनाइज्ड ऑडियो के साथ एक नई 10-सेकंड की क्लिप में बुन सकती है ।

ओमनी फ्लैश द्वारा निर्मित हर वीडियो एआई-जनित सामग्री की उत्पत्ति और पहचान में मदद के लिए गूगल की सिंथआईडी (SynthID) तकनीक से अदृश्य रूप से वॉटरमार्क किया जाता है । हालाँकि एक सीमा 10-सेकंड की अवधि है, गूगल ने कहा है कि यह शुरुआती लॉन्च के लिए एक डिज़ाइन विकल्प है, न कि मॉडल की कोई बाध्यता ।

यह ध्यान रखना महत्वपूर्ण है कि जबकि आप सिंक्रोनाइज्ड ऑडियो के साथ वीडियो जनरेट कर सकते हैं, मॉडल वर्तमान में आपको जनरेटेड वीडियो के भीतर स्पीच या ऑडियो को स्वतंत्र रूप से संपादित करने की अनुमति नहीं देता है - एक ऐसी क्षमता जिसे गूगल फिलहाल जानबूझकर रोक रहा है ।

कौन एक्सेस कर सकता है और इसकी कीमत कितनी है

गूगल ने जेमिनी ओमनी फ्लैश को अपनी घोषणा के दिन ही वैश्विक स्तर पर रोल आउट कर दिया, जिसकी पहुंच मुफ्त और सशुल्क दोनों स्तरों पर फैली हुई है ।

मुफ्त एक्सेस: 18 वर्ष और उससे अधिक आयु के उपयोगकर्ता यूट्यूब शॉर्ट्स रीमिक्स टूल और यूट्यूब क्रिएट ऐप के माध्यम से बिना किसी लागत के मॉडल का उपयोग कर सकते हैं ।
गूगल एआई प्लस: सब्सक्राइबर्स को जेमिनी ऐप और गूगल फ्लो के माध्यम से $7.99 प्रति माह पर एक्सेस मिलता है ।
गूगल एआई प्रो: यह टियर भी $19.99 प्रति माह पर समान सतहों पर एक्सेस प्रदान करता है ।
गूगल एआई अल्ट्रा: मॉडल तक पहुंच के साथ एक उच्च-मूल्य वाला सब्सक्रिप्शन टियर, हालांकि शुरुआती स्रोत सामग्री में कोई विशिष्ट कीमत नहीं बताई गई है ।

डेवलपर और एंटरप्राइज एपीआई एक्सेस अभी लाइव नहीं है। गूगल का कहना है कि यह जेमिनी एपीआई और वर्टेक्स एआई के माध्यम से "आने वाले हफ्तों में" रोल आउट होगा, जो पिछले जेमिनी मॉडल रिलीज के एक परिचित पैटर्न का अनुसरण करता है ।

लाइका ने अपनी विरासत और स्मार्टफोन के बीच एक रेखा खींची

गूगल की घोषणा के कुछ ही हफ्तों बाद, एक प्रतिस्पर्धी दर्शन ने मंच संभाला। मई 2026 के अंत में वियना में शाओमी 17टी प्रो के लॉन्च पर - एक ऐसा फोन जो लाइका-ट्यून्ड कैमरों और जेमिनी ओमनी क्षमताओं दोनों का दावा करता है - लाइका ने जनरेटिव एआई पर अपनी स्थिति बहुत स्पष्ट कर दी ।

लाइका कैमरा एजी में बिजनेस यूनिट मोबाइल के उपाध्यक्ष, मारियस एशवाइलर ने कहा कि कंपनी का दर्शन प्रामाणिक छवियां बनाने के इर्द-गिर्द घूमता है जो वास्तविकता को दोहराती हैं । उन्होंने ओमनी जैसे उपकरणों के साथ सीधा विरोधाभास खींचते हुए कहा, "सबसे अधिक संभावना है, आप इसे लाइका एम कैमरे पर नहीं देखेंगे," और ऑप्टिकल शिल्प कौशल और कैप्चर किए गए पल की शुद्धता के प्रति ब्रांड की प्रतिबद्धता पर जोर दिया ।

हालाँकि, लाइका ने तकनीक को पूरी तरह से खारिज नहीं किया। कंपनी के नेतृत्व ने स्वीकार किया कि जनरेटिव एआई स्मार्टफोन पर पूरी तरह से मायने रखता है। एक ऐसे इकोसिस्टम में जहां कम्प्यूटेशनल फोटोग्राफी पहले से ही मानक है, एआई-संचालित निर्माण और संपादन उपयोगकर्ता अनुभव का एक स्वाभाविक विकास लगता है, न कि परंपरा से विचलन । यह रुख एक स्पष्ट दोहरी रणनीति बनाता है: समर्पित लाइका कैमरे प्रकाश को कैद करने के लिए एक शुद्धतावादी उपकरण बने रहेंगे, जबकि फोन एआई-सहायता प्राप्त निर्माण के लिए कैनवास बन जाएंगे।

भविष्य का रोडमैप: प्रो, अल्ट्रा, और बाकी सब कुछ

गूगल ने असामान्य रूप से सीधे तौर पर कहा है कि फ्लैश मॉडल सिर्फ पहला कदम है। सुंदर पिचाई और डीपमाइंड के सीटीओ कोरे कावुकुओग्लू दोनों ने ओमनी को एक ऐसे मॉडल परिवार के रूप में वर्णित किया जो अंततः "किसी भी इनपुट से कुछ भी बनाने" के लिए डिज़ाइन किया गया है ।

ठोस रूप से, इसका मतलब निकट भविष्य के लिए दो मुख्य दिशाएँ हैं:

वीडियो से परे: जहां फ्लैश की शुरुआत 10-सेकंड के वीडियो क्लिप से होती है, वहीं गूगल पहले ही कह चुका है कि ओमनी मॉडल परिवार भविष्य के संस्करणों में इमेज और टेक्स्ट आउटपुट जनरेट करने के लिए विस्तारित होगा ।
अधिक शक्तिशाली मॉडल: रोडमैप में ओमनी प्रो और ओमनी अल्ट्रा वेरिएंट शामिल हैं। ये मौजूदा फ्लैश मॉडल से अधिक सक्षम होंगे, जो परिवार का सबसे तेज़ और सबसे किफायती स्तर है ।

एक उच्च स्तर पर, गूगल ओमनी को पूर्ण "विश्व मॉडल" की दिशा में एक कदम के रूप में देखता है - ऐसी प्रणालियाँ जो सिर्फ मीडिया नहीं बनातीं, बल्कि सभी तौर-तरीकों में वातावरण को समझ सकती हैं, अनुकरण कर सकती हैं और उनके साथ बातचीत कर सकती हैं । फिलहाल, तत्काल ध्यान उन प्रारूपों के विस्तार पर है जिन्हें ओमनी जनरेट कर सकता है और एपीआई एक्सेस को बिल्डरों के हाथों में सौंपने पर है।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं