Sovellus on nyt saatavilla macOS:n lisäksi iOS:lle ja Androidille, mutta macOS-versio nostaa esiin tietyn mallikurointistrategian . Toisin kuin Ollaman ja LM Studion avoimet kirjastot, jotka antavat käyttäjien ladata lähes minkä tahansa yhteensopivan mallin, macOS:n AI Edge Gallery paljastaa tällä hetkellä viisi Googlen kuratoimaa Gemma-mallia
. Kuten 9to5Mac raportoi, valikoima sisältää mallit Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, Gemma-4 26B -variantin ja FunctionGemma-270M:n
. Tämä käsin poimittu valikoima on Googlen strategian ydin: hallittu, laadun takaava ympäristö
.
Konepellin alla ekosysteemiä pyörittää Googlen oma LiteRT-LM-päättelymoottori. Se tukee CPU-, GPU- ja NPU-taustajärjestelmiä Linuxissa, macOS:ssä ja Windowsissa . Suorituskyvyn lippulaivamallina toimii edelleen Gemma-4-E2B (2,58 Gt), ja virallinen dokumentaatio antaa selkeän kuvan sen kyvyistä MacBook Pro M4:llä
:
Valtava nopeushyppy GPU-kiihdytyksellä osoittaa, kuinka hienosäädetty Googlen pino on Applen Siliconin Metal API:lle, tarjoten lähes välittömän ja sulavakäyttöisen kokemuksen.
Apache 2.0 -lisenssillä julkaistu Gemma 4 12B on tämän julkistuksen kirkkain tähti . Sen suurin erottautumistekijä on arkkitehtuuri. Se on tiheä, vain dekooderia käyttävä muuntaja, joka hyödyntää samaa edistynyttä dekooderirakennetta kuin paljon suurempi Gemma 4 31B Dense -malli
.
Kriittinen innovaatio on sen enkooderiton multimodaalinen rakenne. Useimmat multimodaaliset mallit käyttävät erillisiä, raskaita enkoodereita visuaaliselle (kuten ViT) ja audiodatalle (kuten conformer-kerrokset) kääntääkseen datan kielimallille ymmärrettävään muotoon . Gemma 4 12B poistaa ne kokonaan
. Sen sijaan se käyttää:
Tämä mahdollistaa sen, että malli käsittelee natiivisti tekstiä, kuvia, ääntä ja videota yhdessä yhtenäisessä tietovirrassa . Google väittää arkkitehtuurin tuovan "suorituskykyä, joka lähentelee 26B MoE-malliamme alle puolella muistinkulutuksella", ja kaikki tämä toimii kuluttajakannettavilla, joissa on vain 16 Gt yhtenäismuistia
.
Vertailuarvot tukevat tätä itseluottamusta, ja 12B-mallin suorituskyky on omaa kokoluokkaansa korkeampi. GPQA Diamond -testissä (jatko-opintotasoinen päättely) se saavuttaa vaikuttavat 78,8 pistettä, asettuen lähelle 26B-varianttia. Akateemisissa monivalintavertailuissa, kuten MMLU Pro, se saavuttaa 77,2 %, ja kilpailullisessa matematiikan AIME 2026 -testissä se yltää 77,5 prosenttiin . Koodigeneroinnin LiveCodeBenchin tulos on 72,5 %, mikä osoittaa vankkaa käytännön kyvykkyyttä agenttimaisissa työnkuluissa ja monivaiheisessa päättelyssä
.
Tuotetrion täydentää Google AI Edge Eloquent, sanelusovellus, joka asemoituu suoraksi, maksuttomaksi vaihtoehdoksi maksullisille transkriptiopalveluille . Sovellus hyödyntää Gemma-pohjaisia malleja ja on suunniteltu täysin offline-etusijalla
.
Se ei ole pelkkä puhtaaksikirjoitustyökalu, vaan automaattinen puheen hiomakone. Se "aggressiivisesti karsii" täytesanat, kuten "niinku" ja "tota", korjaa kielioppia lennossa ja muokkaa raa'an, sekavan puheen johdonmukaiseksi, ammattimaiseksi tekstiksi . Tämä tekee siitä enemmänkin viestintätyökalun kuin muistiinpanosovelluksen. Keskeisin erottautumistekijä on hintalappu: ei tilausmaksua eikä käyttökattorajoitusta
. macOS-versio vaatii version 13.0 tai uudemman ja Apple M1 -sirun tai uudemman. App Store -sivulla kuitenkin huomautetaan, että jotkin edistyneet valinnaiset ominaisuudet saattavat vaatia pilvikäsittelyä
.
Tämä julkistus asettaa vastakkain kaksi paikallisen tekoälyn filosofiaa. Googlen strategia on "suljetun puutarhan" lähestymistapa: kuratoitu, Googlen hyväksymä mallivalikoima, tiiviisti integroituna brändättyihin, omiin sovelluksiin (Gallery tutkimiseen, Eloquent saneluun) ja yhtenäiseen päättelymoottoriin (LiteRT-LM), jossa on CLI- ja Python-rajapinta . Tavoitteena on tarjota saumaton, kuluttajalaatuinen kokemus, joka "vain toimii" suoraan laatikosta otettuna.
Tämä on suora vastakohta Ollamalle ja LM Studiolle, jotka asettavat etusijalle maksimaalisen joustavuuden ja valinnanvapauden avoimina kirjastoina, joista käyttäjät voivat vetää minkä tahansa yhteensopivan mallin . On huomionarvoista, että sekä Ollama että LM Studio tukevat jo avoimen lähdekoodin painot omaavaa Gemma 4 12B -mallia, joten Googlen malli ei ole yksinoikeudella sen omassa pinossa
.
Googlen etu piilee sen omassa optimoinnissa, jossa sen omat mallit on hienosäädetty erityisesti sen omaa päättelymoottoria ja Applen Siliconia varten, tuottaen parempaa suorituskykyä ja pienempää muistinkulutusta. Käyttäjän vaihtokauppa on selvä: saat hiotumman ja integroidumman kokemuksen, mutta et voi käyttää malleja Googlen kuratoidun Gemma-perheen ulkopuolelta. Tämä asemoi Googlen nappaamaan käyttäjät, jotka arvostavat luotettavuutta ja helppokäyttöisyyttä kokeellisen vapauden sijaan, luoden selvän tienhaaran paikallisen tekoälyn kehitykselle Macilla.
Comments
0 comments