Aplikasi ini kini tersedia di macOS, iOS, dan Android, tetapi versi macOS menyoroti strategi kurasi model yang spesifik . Tidak seperti pustaka terbuka milik Ollama dan LM Studio, yang memungkinkan pengguna menarik hampir semua model yang kompatibel, AI Edge Gallery untuk macOS saat ini hanya menampilkan lima model Gemma pilihan Google
. Seperti yang dilaporkan oleh 9to5Mac, model yang tersedia meliputi Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, varian Gemma-4 26B, dan FunctionGemma-270M
. Pilihan yang dikurasi secara cermat ini adalah inti dari strategi Google: sebuah lingkungan yang terkontrol dan terjamin kualitasnya
.
Di baliknya, ekosistem ini ditenagai oleh mesin inferensi LiteRT-LM milik Google. Mesin ini mendukung backend CPU, GPU, dan NPU di Linux, macOS, dan Windows . Model unggulan untuk tolok ukur kinerja tetaplah Gemma-4-E2B (2,58 GB), dan dokumentasi resmi memberikan gambaran jelas tentang kemampuannya di MacBook Pro M4
:
Lompatan kecepatan yang sangat besar dengan akselerasi GPU menyoroti betapa optimalnya tumpukan teknologi Google untuk API Metal Apple Silicon, memberikan pengalaman pengguna yang hampir instan dan sangat lancar.
Dirilis di bawah lisensi Apache 2.0, Gemma 4 12B adalah bintang dari peluncuran ini . Arsitekturnya adalah pembeda terbesarnya. Ini adalah transformer dense, decoder-only yang menggunakan struktur decoder canggih yang sama dengan model Gemma 4 31B Dense yang jauh lebih besar
.
Inovasi pentingnya adalah desain multimodal tanpa encoder. Sebagian besar model multimodal menggunakan encoder terpisah yang besar untuk visi (seperti ViT) dan audio (seperti lapisan conformer) untuk menerjemahkan data bagi model bahasa . Gemma 4 12B sepenuhnya menghilangkannya
. Sebagai gantinya, ia menggunakan:
Ini memungkinkan model untuk secara native memproses teks, gambar, audio, dan video dalam satu alur terpadu . Google mengklaim arsitektur ini menghasilkan "kinerja yang mendekati model MoE 26B kami dengan memori kurang dari setengahnya," sambil tetap berjalan di laptop konsumen hanya dengan 16 GB memori terpadu
.
Tolok ukur memperkuat kepercayaan ini, menunjukkan model 12B ini tampil jauh di atas kelas beratnya. Pada GPQA Diamond (penalaran tingkat pascasarjana), model ini mencetak skor mengesankan 78,8, menempatkannya dekat dengan varian 26B. Pada tolok ukur pilihan ganda bergaya akademik seperti MMLU Pro, model ini mencapai 77,2%, dan pada tolok ukur matematika kompetitif AIME 2026 mencetak skor 77,5% . Pada LiveCodeBench untuk pembuatan kode, model ini mencapai skor 72,5%, menunjukkan kemampuan praktis yang kuat dalam alur kerja agentik dan penalaran multi-langkah
.
Melengkapi trio produk ini adalah Google AI Edge Eloquent, aplikasi dikte yang memposisikan diri sebagai alternatif langsung dan gratis untuk layanan transkripsi berbayar . Aplikasi ini didukung oleh model berbasis Gemma dan dirancang untuk sepenuhnya mengutamakan pemrosesan offline
.
Aplikasi ini melampaui transkripsi sederhana dengan bertindak sebagai penyempurna ucapan otomatis. Aplikasi ini "secara agresif memangkas" kata-kata pengisi seperti "eum" dan "anu," memperbaiki tata bahasa secara langsung, dan menyusun ulang ucapan mentah yang kacau menjadi teks yang koheren dan profesional . Hal ini membuatnya lebih merupakan alat komunikasi daripada aplikasi pencatat biasa. Pembeda utamanya adalah label harganya: tidak ada langganan dan tidak ada batasan penggunaan
. Versi macOS memerlukan macOS 13.0 atau lebih baru dan chip Apple M1 atau lebih baru, meskipun halaman App Store mencatat bahwa beberapa fitur opsional canggih mungkin memerlukan pemrosesan awan
.
Peluncuran ini membentuk dua filosofi yang berlawanan untuk AI lokal. Strategi Google adalah pendekatan "taman bertembok" : sekumpulan model yang dikurasi dan disetujui Google, terintegrasi erat dengan aplikasi pihak pertama bermerek (Galeri untuk eksplorasi, Eloquent untuk dikte), dan mesin inferensi terpadu (LiteRT-LM) dengan CLI dan API Python . Tujuannya adalah untuk memberikan pengalaman mulus tingkat konsumen yang "langsung berfungsi" begitu dinyalakan.
Ini sangat kontras dengan Ollama dan LM Studio, yang memprioritaskan fleksibilitas dan pilihan maksimum sebagai pustaka terbuka di mana pengguna dapat menarik model apa pun yang kompatibel . Khususnya, baik Ollama maupun LM Studio sudah mendukung model open-weight Gemma 4 12B, sehingga model Google ini tidak eksklusif untuk tumpukan teknologinya sendiri
.
Keunggulan Google terletak pada optimasi internal, di mana modelnya sendiri disetel secara khusus untuk mesin inferensinya di Apple Silicon demi kinerja yang lebih baik dan penggunaan memori yang lebih rendah. Pilihannya jelas bagi pengguna: Anda mendapatkan pengalaman yang lebih sempurna dan terintegrasi, tetapi Anda tidak dapat menjalankan model di luar keluarga Gemma pilihan Google. Ini memposisikan Google untuk merebut pengguna yang menghargai keandalan dan kemudahan penggunaan di atas kebebasan bereksperimen, menciptakan persimpangan jalan yang jelas untuk AI lokal di Mac.
Comments
0 comments