यह पूरा मैजिक जिस मॉडल से होता है, उसे गूगल जेमिनी 2.5 फ्लैश इमेज कहता है। इसे प्यार से "नैनो-बनाना" भी बुलाया जाता है । खुद गूगल इसे इमेज जनरेशन और एडिटिंग के लिए अपना सबसे बेहतरीन और एडवांस्ड मॉडल बताता है
।
इसकी खास बातें कुछ इस प्रकार हैं:
गूगल ने I/O 2026 में कई ऐसे बड़े ऐलान किए, जो इसी स्पीड और दिशा को आगे बढ़ाते हैं:
जेमिनी ओमनी (Gemini Omni) — "वीडियो के लिए नैनो-बनाना"
यह एक नया मॉडल है जो किसी भी तरह के इनपुट (अभी के लिए खासतौर पर वीडियो) से आउटपुट बना सकता है । गूगल का कहना है कि ओमनी, जेमिनी की समझदारी को उसके जनरेटिव मीडिया मॉडल्स के साथ जोड़ता है, जिससे यह दुनिया को बेहतर समझता है, मल्टीमॉडल है, और बेहतरीन एडिटिंग कर सकता है
। जेमिनी ऐप के रिलीज़ नोट्स में इसे बिल्कुल सही तरीके से समझाया गया है – "यह वीडियो के लिए नैनो-बनाना जैसा है," जहां आप टेक्स्ट, फोटो और वीडियो को मिलाकर वीडियो बना और एडिट कर सकते हैं
। भविष्य में गूगल का इरादा इसे "किसी भी इनपुट से कुछ भी आउटपुट" बनाने वाले मॉडल के रूप में विकसित करने का है
।
जेमिनी 3.5 फ्लैश (Gemini 3.5 Flash) — स्पीड और दिमाग का कॉम्बो
यह जेमिनी ऐप और गूगल सर्च के AI मोड का नया डिफॉल्ट मॉडल बन गया है । गूगल का दावा है कि यह अपनी कैटेगरी के दूसरे फ्रंटियर मॉडल्स के मुकाबले चार गुना तेज़ी से टोकन आउटपुट करता है, और इसे खासतौर पर एजेंटिक टास्क, कोडिंग, मल्टी-स्टेप वर्कफ़्लो और लंबे समय तक चलने वाले कामों के लिए डिज़ाइन किया गया है
।
दूसरे खास ऐलान:
गूगल की रणनीति एक यूनिफाइड, रियल-टाइम मल्टीमॉडल पाइपलाइन बनाने की है, जिसमें बातचीत, कैमरा इनपुट, इमेज जनरेशन और वीडियो क्रिएशन सबकुछ एक साथ आ जाए ।
इन सब ऐलानों को देखकर गूगल की असली ताकत एकीकरण की गहराई (Integration Depth) में नज़र आती है। जेमिनी लाइव "दिखाओ मुझे क्या दिख रहा है" और "कहो क्या बनाना है" के बीच की कड़ी को पूरी तरह से जोड़ देता है। वहीं, जेमिनी ओमनी इसी "बातचीत करके बनाओ" वाले मॉडल को वीडियो और दूसरे मल्टीमॉडल आउटपुट की तरफ बढ़ा रहा है । अब सबसे बड़ा सवाल यह है कि जैसे-जैसे ये फीचर ज़्यादा लोगों तक पहुंचेंगे, असल में ये कितने बेहतरीन तरीके से काम करते हैं
।
Comments
0 comments