Uygulama artık macOS, iOS ve Android'de kullanılabiliyor, ancak macOS sürümü belirli bir model küratörlüğü stratejisini öne çıkarıyor . Kullanıcıların neredeyse tüm uyumlu modelleri çekmesine izin veren Ollama ve LM Studio'nun açık kütüphanelerinin aksine, macOS AI Edge Gallery şu anda Google tarafından seçilmiş beş Gemma modelini sunuyor
. 9to5Mac'in haberine göre, mevcut modeller şunlardır: Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, bir Gemma-4 26B varyantı ve FunctionGemma-270M
. Bu özenle seçilmiş liste, Google'ın stratejisinin kalbidir: kontrollü, kalite güvencesi sağlanmış bir ortam
.
Bu ekosistem, kaputun altında Google'ın LiteRT-LM çıkarım motoru tarafından destekleniyor. Linux, macOS ve Windows'ta CPU, GPU ve NPU arka uçlarını destekler . Performans kıyaslaması için öne çıkan model Gemma-4-E2B (2.58 GB) olmaya devam ediyor ve resmi dokümantasyon, bir MacBook Pro M4 üzerindeki yeteneklerine net bir bakış sunuyor
:
GPU hızlandırmasıyla hızdaki bu devasa sıçrama, Google'ın yığınının Apple Silicon'un Metal API'si için ne kadar iyi optimize edildiğini ve neredeyse anlık, akıcı bir kullanıcı deneyimi sunduğunu gösteriyor.
Apache 2.0 lisansı altında yayınlanan Gemma 4 12B, bu lansmanın yıldızıdır . Mimarisi en büyük farklılaştırıcısıdır. Çok daha büyük olan Gemma 4 31B Dense modeliyle aynı gelişmiş kod çözücü yapısını kullanan yoğun, yalnızca kod çözücülü bir dönüştürücüdür
.
Kritik yenilik, enkodersiz multimodal tasarımıdır. Çoğu multimodal model, dil modeli için veriyi tercüme etmek amacıyla görüntü (ViT gibi) ve ses (conformer katmanları gibi) için ayrı, hantal kodlayıcılar kullanır . Gemma 4 12B bunları tamamen ortadan kaldırır
. Bunun yerine şunları kullanır:
Bu, modelin metin, görüntü, ses ve videoyu tek bir birleşik akışta doğal olarak işlemesine olanak tanır . Google, bu mimarinin "26B MoE modelimize yakın bir performansı, yarıdan daha az bellek kullanımıyla" sunduğunu ve tüm bunları yalnızca 16 GB birleşik bellek ile tüketici dizüstü bilgisayarlarında çalıştırdığını iddia ediyor
.
Kıyaslama testleri bu güveni doğruluyor ve 12B modelinin sıkletinin çok üzerinde bir performans sergilediğini gösteriyor. GPQA Diamond (lisansüstü seviye akıl yürütme) testinde 78.8 gibi etkileyici bir puan alarak 26B varyantına yaklaşıyor. Akademik tarzda çoktan seçmeli kıyaslama testlerinden MMLU Pro'da %77.2, rekabetçi matematik sınavı AIME 2026'da ise %77.5 başarı gösteriyor . Kod üretimi için LiveCodeBench'te ise 72.5% puanına ulaşarak, etmen tabanlı iş akışları ve çok adımlı akıl yürütmede sağlam pratik yetenekler sergiliyor
.
Ürün üçlüsünü tamamlayan Google AI Edge Eloquent, kendisini ücretli transkripsiyon hizmetlerine doğrudan ve ücretsiz bir alternatif olarak konumlandıran bir dikte uygulamasıdır . Uygulama, Gemma tabanlı modellerle güçlendirilmiştir ve tamamen çevrimdışı öncelikli olacak şekilde tasarlanmıştır
.
Basit bir transkripsiyonun ötesine geçerek otomatik bir konuşma düzenleyici gibi davranır. "Şey", "ııı" gibi dolgu kelimelerini "agresif bir şekilde budar", anında dil bilgisini düzeltir ve ham, dağınık konuşmayı tutarlı, profesyonel bir metne dönüştürür . Bu, onu bir not alma uygulamasından çok bir iletişim aracı haline getiriyor. Temel farklılaştırıcı ise fiyat etiketidir: abonelik yok ve kullanım sınırı yok
. macOS sürümü, macOS 13.0 veya üstü ve Apple M1 çipi veya sonrasını gerektirir; ancak App Store sayfası, bazı gelişmiş, isteğe bağlı özelliklerin bulut işleme gerektirebileceğini belirtmektedir
.
Bu lansman, yerel yapay zeka için iki karşıt felsefe oluşturuyor. Google'ın stratejisi bir "kapalı bahçe" yaklaşımıdır: küratörlü, Google onaylı bir model seti; markalı, birinci taraf uygulamalarla sıkı entegrasyon (keşif için Gallery, dikte için Eloquent); ve bir CLI ve Python API'sine sahip birleşik bir çıkarım motoru (LiteRT-LM) . Amaç, kutudan çıktığı gibi çalışan, kusursuz, tüketici sınıfı bir deneyim sunmaktır.
Bu durum, kullanıcıların herhangi bir uyumlu modeli çekebildiği açık kütüphaneler olarak maksimum esneklik ve seçeneğe öncelik veren Ollama ve LM Studio ile doğrudan bir tezat oluşturuyor . Özellikle, hem Ollama hem de LM Studio'nun zaten açık ağırlıklı Gemma 4 12B modelini desteklediğini, dolayısıyla Google'ın modelinin kendi yığınına özel olmadığını belirtmek önemlidir
.
Google'ın avantajı, kendi modellerinin Apple Silicon'daki kendi çıkarım motoru için özel olarak ayarlandığı ve daha iyi performans ve daha düşük bellek kullanımı sağlayan birinci taraf optimizasyonunda yatmaktadır. Kullanıcı için yapılan takas açıktır: daha gösterişli ve entegre bir deneyim elde edersiniz, ancak Google'ın küratörlüğündeki Gemma ailesi dışındaki modelleri çalıştıramazsınız. Bu durum, Google'ı deneysel özgürlük yerine güvenilirlik ve kullanım kolaylığına değer veren kullanıcıları yakalamak için konumlandırıyor ve Mac'te yerel yapay zeka için yolda belirgin bir çatal yaratıyor.
Comments
0 comments