Aplikasi ini kini tersedia di macOS, iOS, dan Android, tetapi versi macOS mengetengahkan strategi pemilihan model yang khusus . Tidak seperti pustaka terbuka Ollama dan LM Studio, yang membolehkan pengguna menarik hampir mana-mana model yang serasi, AI Edge Gallery untuk macOS pada masa ini hanya mendedahkan lima model Gemma yang dipilih sendiri oleh Google
. Menurut laporan oleh 9to5Mac, model yang tersedia termasuk Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, varian Gemma-4 26B, dan FunctionGemma-270M
. Pemilihan yang teliti ini adalah teras strategi Google: persekitaran yang terkawal dan terjamin kualitinya
.
Di sebalik tabir, ekosistem ini dikuasakan oleh enjin inferens LiteRT-LM milik Google. Ia menyokong pemprosesan di CPU, GPU, dan NPU merentasi sistem operasi Linux, macOS, dan Windows . Model yang diketengahkan untuk penanda aras prestasi kekal Gemma-4-E2B (2.58 GB), dan dokumentasi rasmi memberikan gambaran jelas tentang keupayaannya pada MacBook Pro M4
:
Lonjakan kelajuan yang besar dengan pecutan GPU menyerlahkan betapa dioptimumkannya timbunan teknologi Google untuk API Metal Apple Silicon, memberikan pengalaman pengguna yang hampir serta-merta dan lancar.
Dikeluarkan di bawah lesen Apache 2.0, Gemma 4 12B adalah bintang pelancaran ini . Seni binanya adalah pembeza terbesarnya. Ia adalah pengubah padat jenis penyahkod sahaja yang menggunakan struktur penyahkod canggih yang sama seperti model Gemma 4 31B Dense yang lebih besar
.
Inovasi kritikalnya ialah reka bentuk multimodal tanpa pengekod. Kebanyakan model multimodal menggunakan pengekod berasingan yang besar untuk penglihatan (seperti ViT) dan audio (seperti lapisan conformer) untuk menterjemah data ke model bahasa . Gemma 4 12B menyingkirkannya sepenuhnya
. Sebaliknya, ia menggunakan:
Ini membolehkan model memproses secara asli teks, imej, audio dan video dalam satu aliran bersatu . Google mendakwa seni bina ini memberikan "prestasi yang menghampiri model 26B MoE kami dengan penggunaan memori kurang daripada separuh," semuanya berjalan pada komputer riba pengguna dengan hanya 16 GB memori bersatu
.
Penanda aras mengesahkan keyakinan ini, menunjukkan model 12B mengatasi kelas beratnya dengan ketara. Pada GPQA Diamond (penaakulan peringkat siswazah), ia mencatat skor cemerlang 78.8, meletakkannya hampir dengan varian 26B. Pada penanda aras pelbagai pilihan gaya akademik seperti MMLU Pro, ia mencapai 77.2%, dan pada penanda aras matematik kompetitif AIME 2026 ia mencatat skor 77.5% . Pada LiveCodeBench untuk penjanaan kod, ia mencapai skor 72.5%, menunjukkan keupayaan praktikal yang mantap dalam aliran kerja ejen dan penaakulan berbilang langkah
.
Melengkapkan trio produk ini ialah Google AI Edge Eloquent, sebuah aplikasi imlak yang memposisikan dirinya sebagai alternatif langsung dan percuma kepada perkhidmatan transkripsi berbayar . Aplikasi ini dikuasakan oleh model berasaskan Gemma dan direka untuk menjadi luar talian sepenuhnya
.
Ia mengatasi transkripsi mudah dengan bertindak sebagai pengilap pertuturan automatik. Ia "secara agresif membuang" kata-kata pengisi seperti "um" dan "uh," membetulkan tatabahasa secara spontan, dan menstruktur semula pertuturan mentah yang berselerak menjadi teks yang koheren dan profesional . Ini menjadikannya lebih kepada alat komunikasi daripada aplikasi mencatat nota. Pembeza utamanya adalah tanda harga: tiada langganan dan tiada had penggunaan
. Versi macOS memerlukan macOS 13.0 atau lebih baharu dan cip Apple M1 atau lebih baharu, walaupun halaman App Store menyatakan beberapa ciri lanjutan pilihan mungkin memerlukan pemprosesan awan
.
Pelancaran ini mengukuhkan dua falsafah bertentangan untuk AI tempatan. Strategi Google ialah pendekatan "taman berpagar" : set model terpilih yang diluluskan Google, diintegrasikan rapat dengan aplikasi pihak pertama yang berjenama (Galeri untuk eksplorasi, Eloquent untuk imlak), dan enjin inferens bersatu (LiteRT-LM) dengan CLI dan API Python . Matlamatnya adalah untuk menyediakan pengalaman lancar gred pengguna yang "terus berfungsi" sebaik sahaja dibuka.
Ini bertentangan langsung dengan Ollama dan LM Studio, yang mengutamakan fleksibiliti dan pilihan maksimum sebagai pustaka terbuka di mana pengguna boleh menarik mana-mana model yang serasi . Perlu diperhatikan bahawa kedua-dua Ollama dan LM Studio sudah menyokong model Gemma 4 12B terbuka, jadi model Google tidak eksklusif kepada timbunannya sendiri
.
Kelebihan Google terletak pada pengoptimuman pihak pertama, di mana modelnya sendiri ditala khusus untuk enjin inferensnya pada Apple Silicon untuk prestasi yang lebih baik dan penggunaan memori yang lebih rendah. Pertukaran untuk pengguna adalah jelas: anda mendapat pengalaman yang lebih lancar dan bersepadu, tetapi anda tidak boleh menjalankan model di luar keluarga Gemma terpilih Google. Ini meletakkan Google untuk menarik pengguna yang menghargai kebolehpercayaan dan kemudahan penggunaan berbanding kebebasan eksperimen, mencipta persimpangan yang jelas untuk AI tempatan di Mac.
Comments
0 comments