Appen er nu tilgængelig på macOS, iOS og Android, men det er på Mac, at Googles egentlige strategi omkring modeludvælgelse bliver tydelig . I modsætning til de åbne biblioteker hos Ollama og LM Studio, hvor du frit kan hente næsten enhver kompatibel model, eksponerer AI Edge Gallery på macOS i øjeblikket fem nøje udvalgte Gemma-modeller
. Ifølge mediet 9to5Mac drejer det sig om Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, en Gemma-4 26B-variant og FunctionGemma-270M
. Dette håndplukkede sortiment er kernen i Googles "walled garden"-tilgang: et kontrolleret, kvalitetssikret miljø, der garanterer en stabil oplevelse
.
Hele økosystemet drives af Googles egen inferensmotor, LiteRT-LM. Den understøtter CPU, GPU og NPU på tværs af Linux, macOS og Windows, hvilket gør den ekstremt fleksibel . Den model, der fremhæves i de officielle præstationstal, er Gemma-4-E2B (2,58 GB), og dokumentationen giver et klart billede af, hvad systemet kan præstere på en MacBook Pro med M4-chip
:
Springet i hastighed ved at aktivere GPU-acceleration understreger, hvor fintunet Googles teknologi er til Apple Silicons Metal API. Resultatet er en nærmest øjeblikkelig og flydende brugeroplevelse, der fjerner den frustration, man ofte oplever med langsomme AI-modeller.
Gemma 4 12B er udgivet under den åbne Apache 2.0-licens og er uden tvivl stjernen i denne lancering . Dens arkitektur er dens største differentiator. Det er en "dense", decoder-only transformer, der bygger på den samme avancerede decoder-struktur som den meget større Gemma 4 31B Dense-model
.
Den afgørende innovation er dens encoder-fri, multimodale design. De fleste multimodale modeller bruger separate, pladskrævende encodere til at oversætte data for sprogmodellen – for eksempel en vision transformer (ViT) til billeder og conformer-lag til lyd . Gemma 4 12B har fjernet dem helt
. I stedet bruger den:
Dette gør, at modellen på naturlig vis kan bearbejde tekst, billeder, lyd og video i ét samlet flow . Google hævder, at denne arkitektur leverer "ydeevne, der nærmer sig vores 26B MoE-model med mindre end halvdelen af hukommelsesforbruget", og at den kan køre på almindelige forbruger-bærbare med kun 16 GB unified memory
.
Benchmarks understøtter denne påstand. Modellen slår langt over sin egen vægtklasse. På GPQA Diamond, en test af ræsonnement på højt niveau, scorer den imponerende 78,8 og placerer sig tæt på 26B-varianten. På den akademiske multiple choice-benchmark MMLU Pro opnår den 77,2 %, og på den konkurrenceprægede matematiktest AIME 2026 scorer den 77,5 % . Inden for kodegenerering rammer den en score på 72,5 % på LiveCodeBench, hvilket viser robuste, praktiske evner inden for agent-baserede arbejdsgange og flertrins-ræsonnement
.
Sidste del af lanceringen er Google AI Edge Eloquent, en dikteringsapp, der positionerer sig som et direkte og gratis alternativ til betalte transskriptionstjenester . Appen er drevet af Gemma-baserede modeller og er designet til at fungere 100 % offline
.
Den er langt mere end en simpel talegenkender. Den fungerer som en automatisk talepudser, der "aggressivt trimmer" fyldord som "øh" og "hm", korrigerer grammatik i realtid og omstrukturerer rodet talesprog til sammenhængende, professionel tekst . Den er dermed mere et kommunikationsværktøj end en note-app. Den største fordel ligger i prisen: Der er intet abonnement og ingen begrænsning på brugen
. macOS-versionen kræver macOS 13.0 eller nyere og en Mac med mindst en M1-chip. App Store-siden nævner dog, at visse valgfrie, avancerede funktioner kan kræve cloud-behandling
.
Denne lancering etablerer to modstridende filosofier for lokal AI. Googles strategi er en "walled garden", en lukket have: Et kurateret, Google-godkendt sæt modeller, tæt integreret med brandede førstepartsapps (Gallery til udforskning, Eloquent til diktering) og en samlet inferensmotor (LiteRT-LM) med CLI og Python API . Målet er at levere en problemfri forbrugeroplevelse, der "bare virker" ud af boksen.
Det står i skarp kontrast til Ollama og LM Studio, der prioriterer maksimal fleksibilitet og valgfrihed som åbne biblioteker, hvor brugerne selv kan hente enhver kompatibel model . Det er værd at bemærke, at både Ollama og LM Studio allerede understøtter den åbne Gemma 4 12B-model, så Google har ikke gjort deres model eksklusiv for deres egen platform
.
Googles fordel ligger i førstepartsoptimering, hvor deres egne modeller er specifikt tunet til deres inferensmotor på Apple Silicon for at opnå bedre ydeevne og lavere hukommelsesforbrug. Kompromiset for brugeren er klart: Du får en mere poleret, integreret og pålidelig oplevelse, men du binder dig samtidig til Googles kuraterede Gemma-univers og kan ikke frit afprøve eksperimentelle modeller udefra. Dette placerer Google i en position, hvor de kan tiltrække brugere, der vægter stabilitet og brugervenlighed højere end eksperimentel frihed, og det skaber en tydelig skillevej for fremtidens lokale AI på Mac.
Comments
0 comments