यह एप्लिकेशन अब macOS, iOS और Android पर उपलब्ध है, लेकिन macOS संस्करण एक विशिष्ट मॉडल क्यूरेशन रणनीति को सामने लाता है । Ollama और LM Studio की खुली लाइब्रेरियों के विपरीत, जो उपयोगकर्ताओं को लगभग किसी भी संगत मॉडल को खींचने की सुविधा देती हैं, macOS AI Edge Gallery वर्तमान में पाँच Google-क्यूरेटेड Gemma मॉडल प्रदान करती है
। 9to5Mac की रिपोर्ट के अनुसार, उपलब्ध मॉडलों में Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, एक Gemma-4 26B वेरिएंट, और FunctionGemma-270M शामिल हैं
। यह हाथ से चुना गया चयन Google की रणनीति का केंद्र है: एक नियंत्रित, गुणवत्ता-सुनिश्चित वातावरण
।
अंदरूनी तौर पर, यह इकोसिस्टम Google के LiteRT-LM इंफ़रेंस इंजन द्वारा संचालित है। यह Linux, macOS और Windows पर CPU, GPU और NPU बैकएंड को सपोर्ट करता है । प्रदर्शन बेंचमार्किंग के लिए मुख्य मॉडल Gemma-4-E2B (2.58 GB) बना हुआ है, और आधिकारिक दस्तावेज़ीकरण MacBook Pro M4 पर इसकी क्षमताओं की एक स्पष्ट तस्वीर प्रस्तुत करता है
:
GPU एक्सीलरेशन के साथ गति में भारी उछाल यह दर्शाता है कि Google का स्टैक Apple Silicon के Metal API के लिए कितना ट्यून्ड है, जो लगभग तात्कालिक, तरल उपयोगकर्ता अनुभव प्रदान करता है।
Apache 2.0 लाइसेंस के तहत जारी, Gemma 4 12B इस लॉन्च का सितारा है । इसकी आर्किटेक्चर ही इसका सबसे बड़ा अंतर है। यह एक डेंस, डिकोडर-ओनली ट्रांसफॉर्मर है जो बहुत बड़े Gemma 4 31B Dense मॉडल के समान उन्नत डिकोडर संरचना का उपयोग करता है
।
महत्वपूर्ण नवाचार इसका एनकोडर-रहित मल्टीमॉडल डिज़ाइन है। अधिकांश मल्टीमॉडल मॉडल भाषा मॉडल के लिए डेटा का अनुवाद करने हेतु विज़न (जैसे ViT) और ऑडियो (जैसे कॉनफ़ॉर्मर लेयर्स) के लिए अलग, भारी एनकोडर का उपयोग करते हैं । Gemma 4 12B उन्हें पूरी तरह से खत्म कर देता है
। इसके बजाय, यह निम्नलिखित का उपयोग करता है:
यह मॉडल को एक ही एकीकृत प्रवाह में टेक्स्ट, इमेज, ऑडियो और वीडियो को मूल रूप से प्रोसेस करने की अनुमति देता है । Google का दावा है कि यह आर्किटेक्चर "हमारे 26B MoE मॉडल के प्रदर्शन के करीब आधी से भी कम मेमोरी के साथ" प्रदान करता है, और यह सब सिर्फ़ 16 जीबी यूनिफाइड मेमोरी वाले उपभोक्ता लैपटॉप पर चलता है
।
बेंचमार्क इस विश्वास की पुष्टि करते हैं, यह दर्शाते हुए कि 12B मॉडल अपने भार वर्ग से कहीं ऊपर प्रदर्शन करता है। GPQA Diamond (स्नातक-स्तरीय तर्क) पर, यह प्रभावशाली 78.8 स्कोर करता है, जो इसे 26B वेरिएंट के करीब रखता है। MMLU Pro जैसे अकादमिक-शैली के बहुविकल्पीय बेंचमार्क पर, यह 77.2% हासिल करता है, और प्रतिस्पर्धी गणित बेंचमार्क AIME 2026 पर यह 77.5% स्कोर करता है । कोड जनरेशन के लिए LiveCodeBench पर, यह 72.5% का स्कोर प्राप्त करता है, जो एजेंटिक वर्कफ़्लो और मल्टी-स्टेप रीज़निंग में मज़बूत व्यावहारिक क्षमताओं को प्रदर्शित करता है
।
उत्पाद तिकड़ी को पूरा करता है Google AI Edge Eloquent, एक डिक्टेशन ऐप जो खुद को भुगतान वाली ट्रांसक्रिप्शन सेवाओं के प्रत्यक्ष, मुफ़्त विकल्प के रूप में स्थापित करता है । यह ऐप Gemma-आधारित मॉडलों द्वारा संचालित है और इसे पूरी तरह से ऑफ़लाइन-फ़र्स्ट होने के लिए डिज़ाइन किया गया है
।
यह एक स्वचालित स्पीच पॉलिशर के रूप में कार्य करके सरल ट्रांसक्रिप्शन से आगे निकल जाता है। यह "अम्म" और "उह" जैसे फ़िलर शब्दों को "आक्रामक रूप से हटा देता है", तुरंत व्याकरण को ठीक करता है, और कच्चे, अव्यवस्थित भाषण को सुसंगत, पेशेवर पाठ में पुनर्गठित करता है । यह इसे नोट लेने वाले ऐप से ज़्यादा एक संचार उपकरण बनाता है। मुख्य विभेदक मूल्य टैग है: कोई सदस्यता नहीं है और कोई उपयोग सीमा नहीं है
। macOS संस्करण के लिए macOS 13.0 या बाद का संस्करण और Apple M1 चिप या बाद का चिप आवश्यक है, हालांकि ऐप स्टोर पेज नोट करता है कि कुछ उन्नत, वैकल्पिक सुविधाओं के लिए क्लाउड प्रोसेसिंग की आवश्यकता हो सकती है
।
यह लॉन्च स्थानीय AI के लिए दो विरोधी दर्शन स्थापित करता है। Google की रणनीति एक "वॉल्ड गार्डन" दृष्टिकोण है: मॉडलों का एक क्यूरेटेड, Google-अनुमोदित सेट, जो ब्रांडेड, फ़र्स्ट-पार्टी ऐप्स (एक्सप्लोरेशन के लिए Gallery, डिक्टेशन के लिए Eloquent) और एक CLI और Python API के साथ एक एकीकृत इंफ़रेंस इंजन (LiteRT-LM) के साथ मज़बूती से एकीकृत है । लक्ष्य एक सहज, कंज़्यूमर-ग्रेड अनुभव प्रदान करना है जो बॉक्स से बाहर निकलते ही "काम करता है"।
यह Ollama और LM Studio के बिल्कुल विपरीत है, जो खुली लाइब्रेरियों के रूप में अधिकतम लचीलेपन और विकल्प को प्राथमिकता देते हैं, जहाँ उपयोगकर्ता कोई भी संगत मॉडल खींच सकते हैं । उल्लेखनीय रूप से, Ollama और LM Studio दोनों पहले से ही ओपन-वेट Gemma 4 12B मॉडल का समर्थन करते हैं, इसलिए Google का मॉडल उसके अपने स्टैक के लिए अनन्य नहीं है
।
Google का लाभ फ़र्स्ट-पार्टी ऑप्टिमाइज़ेशन में निहित है, जहाँ उसके अपने मॉडल विशेष रूप से बेहतर प्रदर्शन और कम मेमोरी उपयोग के लिए Apple Silicon पर उसके इंफ़रेंस इंजन के लिए ट्यून किए गए हैं। उपयोगकर्ता के लिए समझौता स्पष्ट है: आपको अधिक पॉलिश्ड और एकीकृत अनुभव मिलता है, लेकिन आप Google के क्यूरेटेड Gemma परिवार के बाहर के मॉडल नहीं चला सकते। यह Google को उन उपयोगकर्ताओं को आकर्षित करने की स्थिति में रखता है जो प्रायोगिक स्वतंत्रता पर विश्वसनीयता और उपयोग में आसानी को महत्व देते हैं, जो Mac पर स्थानीय AI के लिए रास्ते में एक स्पष्ट मोड़ बनाता है।
Comments
0 comments