Aplikace je nyní dostupná pro macOS, iOS i Android, ale právě verze pro macOS odhaluje promyšlenou strategii kurátorství modelů . Na rozdíl od otevřených knihoven Ollama a LM Studio, kde si uživatelé mohou stáhnout téměř jakýkoli kompatibilní model, macOS verze AI Edge Gallery v současnosti nabízí pět modelů Gemma, pečlivě vybraných Googlem
. Jak uvádí server 9to5Mac, mezi dostupnými modely najdete Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, variantu Gemma-4 26B a FunctionGemma-270M
. Tento ručně vybraný výběr je jádrem strategie Googlu: kontrolované prostředí s garantovanou kvalitou
.
Celý ekosystém pohání inferenční engine LiteRT-LM od Googlu. Ten podporuje procesory (CPU, GPU a NPU) na platformách Linux, macOS i Windows . Hlavním modelem pro výkonnostní benchmarky zůstává Gemma-4-E2B (2,58 GB) a oficiální dokumentace nabízí jasný pohled na jeho schopnosti na MacBooku Pro M4
:
Obrovský skok v rychlosti s GPU akcelerací ukazuje, jak dobře je stack Googlu vyladěný pro API Metal od Apple Silicon, a přináší téměř okamžitou a plynulou uživatelskou zkušenost.
Hvězdou celého uvedení je model Gemma 4 12B, vydaný pod licencí Apache 2.0 . Jeho největším odlišovacím prvkem je architektura. Jedná se o hustý, pouze dekodérový transformer, který využívá stejnou pokročilou strukturu dekodéru jako mnohem větší model Gemma 4 31B Dense
.
Klíčovou inovací je jeho multimodální design bez enkodérů. Většina multimodálních modelů používá samostatné, objemné enkodéry pro vidění (jako ViT) a zvuk (jako vrstvy konformeru), aby přeložily data pro jazykový model . Gemma 4 12B je zcela eliminuje
. Místo nich používá:
To modelu umožňuje nativně zpracovávat text, obrázky, zvuk a video v jednom jednotném toku . Google tvrdí, že tato architektura přináší „výkon blížící se našemu 26B MoE modelu s méně než polovinou paměti
Comments
0 comments