目前這款應用已能在 macOS、iOS 和 Android 上取得,但 macOS 版本突顯了一套獨特的模型策展策略。 有別於 Ollama 和 LM Studio 那種幾乎讓使用者能拉取任何相容模型的開放式程式庫,macOS 版的 AI Edge Gallery 目前只提供五款由 Google 精心挑選的 Gemma 模型。
根據《9to5Mac》的報導,這些可用的模型包括 Gemma-4-12B-it、Gemma-4-E2B-it、Gemma-4-E4B-it、一款 Gemma-4 26B 的變體,還有 FunctionGemma-270M。
這種百里挑一的選擇,正是 Google 策略的核心:一個受控且品質經過保證的環境。
在底層驅動這個生態系的,是 Google 自家的 LiteRT-LM 推論引擎。它能在 Linux、macOS 和 Windows 上支援 CPU、GPU 和 NPU 等後端。 官方文件中用來展示效能基準的代表性模型是 Gemma-4-E2B(2.58 GB),並清楚列出了它在 MacBook Pro M4 上的能耐:
啟動 GPU 加速後,速度出現巨幅躍升,這凸顯了 Google 的軟體堆疊為了 Apple Silicon 的 Metal API 進行了何等深度的調校,從而帶來近乎瞬時且流暢的使用者體驗。
Gemma 4 12B 採用 Apache 2.0 授權釋出,是這次發表會的主角。 它最大的差異化特色在於其架構:這是一款稠密、僅解碼器的 Transformer 模型,使用與體積大得多的 Gemma 4 31B Dense 模型相同的先進解碼器結構。
其關鍵的創新就在於無編碼器的多模態設計。多數多模態模型會分別使用龐大的視覺編碼器(如 ViT)和音訊編碼器(如 conformer 層),將資料轉譯給語言模型使用。 Gemma 4 12B 則是完全摒棄了它們。
取而代之的是:
這讓模型得以在一個統一的流程中,原生處理文字、圖片、音訊和影片。 Google 聲稱,這種架構能「以不到一半的記憶體,實現逼近我們 26B MoE 模型的效能」,而且一切都能在僅配備 16 GB 統一記憶體的消費級筆電上運行。
基準測試結果也印證了這份自信,顯示這款 12B 的模型足以「越級打怪」。在 GPQA Diamond(研究生等級的推理測驗)中,它拿下了驚人的 78.8 分,貼近 26B 變體的表現。在學術風格的選擇題基準 MMLU Pro 上達成 77.2%,在競爭激烈的數學基準 AIME 2026 中則獲得 77.5%。 而在程式碼生成的 LiveCodeBench 中,它達到了 72.5% 的分數,展現出在代理工作流程和多步驟推理上的扎實實用能力。
作為這波產品三連發的最後一塊拼圖,Google AI Edge Eloquent 是一款聽寫應用程式,它將自己定位為付費轉錄服務直接的免費替代品。 這款應用由基於 Gemma 的模型驅動,並以「離線優先」為核心設計理念。
它的能耐不僅止於單純的轉錄,更像是一款自動的語音修飾器。它會「積極地修剪掉」像是「嗯」和「啊」之類的贅語,即時修正文法,並將雜亂無章的口語重組為流暢、專業的書面文字。 這讓它更像是個溝通工具,而不只是筆記軟體。它最關鍵的差異化優勢在於價格:既無訂閱制,也沒有使用上限。
macOS 版本需要 macOS 13.0 或更新系統,以及 Apple M1 或後續晶片,不過 App Store 頁面也註記了部分進階的選用功能可能需要用到雲端處理。
這次的發表,確立了地端 AI 領域兩種截然不同的理念。
Google 的策略是一種**「圍牆花園」式途徑**:一套由 Google 策劃並認可的模型,與品牌化的第一方應用深度整合(用 Gallery 來探索、用 Eloquent 來聽寫),並搭配一個俱備命令列介面和 Python API 的統一推論引擎(LiteRT-LM)。 其目標是提供一個開箱即用、無縫接軌的消費級體驗。
這與 Ollama 和 LM Studio 形成了直接對比。後兩者將最大化的彈性與選擇列為最優先,它們是開放的程式庫,讓使用者可以拉取任何相容的模型。 值得注意的是,Ollama 和 LM Studio 都已經支援開放權重的 Gemma 4 12B 模型,因此 Google 的模型並非其自身技術堆疊的獨佔品。
Google 的優勢在於第一方的最佳化,他們自家模型針對 Apple Silicon 上的自有推論引擎進行了專門調校,因而能達到更好的效能與更低的記憶體用量。對使用者而言,這當中的取捨顯而易見:你得到了一個更精緻、更整合的體驗,但你無法運行 Google 策展 Gemma 家族以外的模型。這將讓 Google 得以吸引那些重視可靠性與易用性勝過實驗自由的用戶,為 Mac 上的地端 AI 開創出一條涇渭分明的岔路。
Comments
0 comments