Applikasjonen er nå tilgjengelig på macOS, iOS og Android. For macOS-versjonen blir en spesifikk strategi for modellkuratering tydelig . I motsetning til de åpne bibliotekene til Ollama og LM Studio, der du kan hente nesten hvilken som helst kompatibel modell, tilbyr macOS-versjonen av AI Edge Gallery for øyeblikket kun fem håndplukkede Gemma-modeller
. Ifølge 9to5Mac inkluderer de tilgjengelige modellene Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, en Gemma-4 26B-variant og FunctionGemma-270M
. Dette utvalget er kjernen i Googles strategi: et kontrollert miljø med garantert kvalitet
.
Under panseret drives økosystemet av Googles egen inferensmotor, LiteRT-LM. Den støtter prosessering på CPU, GPU og NPU på tvers av Linux, macOS og Windows . Modellen som brukes til ytelsesmålinger er Gemma-4-E2B (2,58 GB), og den offisielle dokumentasjonen gir et klart bilde av kapasiteten på en MacBook Pro med M4-brikke
:
Det enorme spranget i hastighet med GPU-akselerasjon viser hvor godt Googles teknologi er tilpasset Metal-rammeverket i Apple Silicon, og gir en nærmest øyeblikkelig og flytende brukeropplevelse.
Utgitt under Apache 2.0-lisensen er Gemma 4 12B stjernen i denne lanseringen . Arkitekturen er dens største fortrinn. Det er en tett, dekoderbasert transformermodell som bruker den samme avanserte dekoderstrukturen som den mye større Gemma 4 31B Dense-modellen
.
Den kritiske innovasjonen er dens enkoderfrie, multimodale design. De fleste multimodale modeller bruker separate, tunge enkodere for syn (som en ViT) og lyd (som conformer-lag) for å oversette data for språkmodellen . Gemma 4 12B eliminerer dem fullstendig
. I stedet bruker den:
Dette gjør at modellen kan prosessere tekst, bilder, lyd og video i en enhetlig flyt . Google hevder at denne arkitekturen gir «ytelse som nærmer seg vår 26B MoE-modell med mindre enn halvparten av minnebruken», og alt dette mens den kjører på bærbare forbrukermaskiner med kun 16 GB delt minne
.
Ytelsestester bekrefter denne selvtilliten og viser at 12B-modellen slår langt over sin vektklasse. På GPQA Diamond (resonnering på forskernivå) oppnår den imponerende 78,8, noe som plasserer den nær 26B-varianten. På akademiske flervalgstester som MMLU Pro oppnår den 77,2 %, og på den konkurransepregede mattetesten AIME 2026 skårer den 77,5 % . På LiveCodeBench for kodegenerering når den en poengsum på 72,5 %, noe som viser robuste praktiske evner innen agent-baserte arbeidsflyter og flertrinns resonnering
.
Det tredje produktet er Google AI Edge Eloquent, en dikteringsapp som posisjonerer seg som et direkte, gratis alternativ til betalte transkripsjonstjenester . Appen drives av Gemma-baserte modeller og er designet for å fungere helt uten internett
.
Appen er mer enn enkel transkripsjon; den fungerer som en automatisk talepolerer. Den «kutter aggressivt ut» fyllord som «eh» og «hm», retter grammatikk i farta og omstrukturerer rå, kaotisk tale til sammenhengende, profesjonell tekst . Dette gjør den mer til et kommunikasjonsverktøy enn en notatapp. Den store forskjellen er prislappen: det er ingen abonnementsavgift og ingen bruksgrense
. macOS-versjonen krever macOS 13.0 eller nyere og en Mac med Apple M1-brikke eller nyere, men App Store-siden påpeker at enkelte avanserte tilleggsfunksjoner kan kreve skyprosessering
.
Denne lanseringen etablerer to motstridende filosofier for lokal AI. Googles strategi er en «inngjerdet hage»-tilnærming: et kuratert, Google-godkjent sett med modeller, tett integrert med merkede apper (Gallery for utforsking, Eloquent for diktering) og en enhetlig inferensmotor (LiteRT-LM) med CLI og Python-API . Målet er å gi en sømløs forbrukeropplevelse som «bare virker» rett ut av esken.
Dette står i direkte kontrast til Ollama og LM Studio, som prioriterer maksimal fleksibilitet og valgfrihet som åpne biblioteker der brukere kan hente enhver kompatibel modell . Det er verdt å merke seg at både Ollama og LM Studio allerede støtter den åpne Gemma 4 12B-modellen, så Googles modell er ikke eksklusiv for deres egen programvare
.
Googles fordel ligger i en spesialtilpasset optimalisering, der deres egne modeller er finjustert for deres egen inferensmotor på Apple Silicon for bedre ytelse og lavere minnebruk. Avveiningen for brukeren er klar: du får en mer polert og integrert opplevelse, men du kan ikke kjøre modeller utenfor Googles kuraterte Gemma-familie. Dette posisjonerer Google for å kapre brukere som verdsetter pålitelighet og brukervennlighet foran eksperimentell frihet, og skaper et tydelig veiskille for lokal AI på Mac.
Comments
0 comments