Aplikacja jest już dostępna na macOS, iOS i Androida, ale to wersja na macOS uwypukla konkretną strategię selekcji modeli . W przeciwieństwie do otwartych bibliotek, takich jak Ollama i LM Studio, które pozwalają użytkownikom na pobranie niemal każdego kompatybilnego modelu, wersja AI Edge Gallery na macOS obecnie udostępnia pięć, wyselekcjonowanych przez Google, modeli Gemma
. Jak podaje 9to5Mac, dostępne modele to Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, wariant Gemma-4 26B oraz FunctionGemma-270M
. Ten ręcznie wybrany zestaw stanowi sedno strategii Google: kontrolowane środowisko z zagwarantowaną jakością
.
Pod maską ekosystem napędzany jest przez silnik wnioskowania Google, LiteRT-LM. Obsługuje on backendy CPU, GPU i NPU na systemach Linux, macOS i Windows . Modelem referencyjnym dla testów wydajności pozostaje Gemma-4-E2B (2,58 GB), a oficjalna dokumentacja daje jasny obraz jego możliwości na MacBooku Pro M4
:
Ogromny skok prędkości przy akceleracji GPU pokazuje, jak dobrze stos technologiczny Google jest zoptymalizowany pod kątem interfejsu Metal w Apple Silicon, zapewniając niemal natychmiastowe i płynne działanie.
Wydany na licencji Apache 2.0, Gemma 4 12B jest gwiazdą tej premiery . Jego architektura jest jego największym wyróżnikiem. Jest to gęsty transformer typu decoder-only, wykorzystujący tę samą zaawansowaną strukturę dekodera, co znacznie większy model Gemma 4 31B Dense
.
Kluczową innowacją jest jego pozbawiona enkoderów multimodalna konstrukcja. Większość modeli multimodalnych używa osobnych, nieporęcznych enkoderów dla obrazu (jak ViT) i dźwięku (jak warstwy konformerów), aby przetłumaczyć dane dla modelu językowego . Gemma 4 12B eliminuje je całkowicie
. Zamiast nich stosuje:
Dzięki temu model może natywnie przetwarzać tekst, obrazy, dźwięk i wideo w jednym, ujednoliconym przepływie . Google twierdzi, że architektura ta zapewnia "wydajność zbliżoną do naszego modelu 26B MoE przy mniej niż połowie pamięci", a wszystko to podczas pracy na laptopach konsumenckich z zaledwie 16 GB pamięci zunifikowanej
.
Testy porównawcze potwierdzają to przekonanie, pokazując, że model 12B znacznie przewyższa swoją kategorię wagową. W teście GPQA Diamond (rozumowanie na poziomie magisterskim) osiąga imponujący wynik 78,8, plasując się blisko wariantu 26B. W akademickich testach wielokrotnego wyboru, takich jak MMLU Pro, osiąga 77,2%, a w konkurencyjnym teście matematycznym AIME 2026 — 77,5% . W teście generowania kodu LiveCodeBench osiąga wynik 72,5%, demonstrując solidne praktyczne możliwości w zadaniach agentowych i wieloetapowym rozumowaniu
.
Triadę produktów uzupełnia Google AI Edge Eloquent, aplikacja do dyktowania, która pozycjonuje się jako bezpośrednia, darmowa alternatywa dla płatnych usług transkrypcji . Aplikacja oparta jest na modelach Gemma i zaprojektowana tak, aby działać całkowicie offline
.
Wykracza poza prostą transkrypcję, działając jako automatyczny redaktor mowy. "Agresywnie wycina" słowa wypełniacze, takie jak "yyy" czy "eee", poprawia gramatykę na bieżąco i przekształca surową, chaotyczną mowę w spójny, profesjonalny tekst . Czyni ją to bardziej narzędziem do komunikacji niż aplikacją do robienia notatek. Kluczowym wyróżnikiem jest cena: nie ma subskrypcji i żadnych limitów użytkowania
. Wersja na macOS wymaga systemu macOS 13.0 lub nowszego oraz układu Apple M1 lub nowszego, choć w App Store widnieje informacja, że niektóre zaawansowane, opcjonalne funkcje mogą wymagać przetwarzania w chmurze
.
Ta premiera ustanawia dwie przeciwstawne filozofie dla lokalnej AI. Strategia Google to podejście "zamkniętego ogrodu": wyselekcjonowany, zatwierdzony przez Google zestaw modeli, ściśle zintegrowany z markowymi aplikacjami własnymi (Gallery do eksploracji, Eloquent do dyktowania) oraz ujednoliconym silnikiem wnioskowania (LiteRT-LM) z CLI i API Pythona . Celem jest zapewnienie płynnego, przyjaznego konsumentowi doświadczenia, które "po prostu działa" od razu po wyjęciu z pudełka.
Stoi to w bezpośredniej sprzeczności z Ollamą i LM Studio, które stawiają na maksymalną elastyczność i wybór jako otwarte biblioteki, z których użytkownicy mogą pobrać dowolny kompatybilny model . Co istotne, zarówno Ollama, jak i LM Studio już obsługują model Gemma 4 12B o otwartych wagach, więc model Google nie jest wyłączny dla jego własnego stosu technologicznego
.
Przewaga Google leży w optymalizacji od pierwszej strony, gdzie jego własne modele są dostrojone specjalnie pod jego silnik wnioskowania na układach Apple Silicon, co zapewnia lepszą wydajność i mniejsze zużycie pamięci. Kompromis dla użytkownika jest jasny: otrzymuje on bardziej dopracowane i zintegrowane doświadczenie, ale nie może uruchamiać modeli spoza wyselekcjonowanej rodziny Gemma Google. Stawia to Google w pozycji, aby zdobyć użytkowników ceniących niezawodność i łatwość użytkowania ponad swobodę eksperymentowania, tworząc wyraźne rozdroże w rozwoju lokalnej AI na Macu.
Comments
0 comments