現在、このアプリケーションはmacOS、iOS、Androidで利用可能ですが、macOS版には特定のモデル選定戦略が色濃く反映されています 。OllamaやLM Studioが、互換性のあるほぼすべてのモデルをユーザーが自由に導入できる「開かれた図書館」であるのに対し、macOS版AI Edge Galleryが公開するのは、 Googleが厳選した5つのGemmaモデル のみです
。『9to5Mac』が報じたところによると、利用可能なモデルは、Gemma-4-12B-it、Gemma-4-E2B-it、Gemma-4-E4B-it、Gemma-4 26Bのバリアント、そしてFunctionGemma-270Mです
。この手厳選された品揃えこそが、Googleの戦略の中核であり、品質が保証された管理環境を提供することを意味します
。
このエコシステムを陰で支えるのが、Googleの推論エンジン「LiteRT-LM」です。Linux、macOS、Windowsにわたり、CPU、GPU、NPUの各バックエンドをサポートしています 。パフォーマンスベンチマークの代表モデルは「Gemma-4-E2B」(2.58 GB)で、公式ドキュメントにはMacBook Pro M4での性能が克明に記されています
。
GPUアクセラレーションによる速度の飛躍的な向上は、GoogleのスタックがいかにApple SiliconのMetal API向けに綿密にチューニングされ、ほぼ一瞬で応答する流動的なユーザー体験を実現しているかを如実に示しています。
Apache 2.0ライセンスの下で公開されたGemma 4 12Bは、今回の発表の主役です 。その最大の差別化要因は、アーキテクチャにあります。これは、はるかに大規模なGemma 4 31B Denseモデルと同じ高度なデコーダー構造を採用した、高密度のデコーダーオンリーTransformer なのです
。
決定的なイノベーションは、エンコーダーフリーのマルチモーダルデザイン にあります。たいていのマルチモーダルモデルは、視覚(ViTのような)や音声(コンフォーマー層のような)の情報を言語モデル用に翻訳するために、別個のかさばるエンコーダーを使用します 。Gemma 4 12Bは、それらを完全に排除しました
。代わりに、以下の手法を採用しています。
これにより、テキスト、画像、音声、動画 を単一の統合フローでネイティブ処理することが可能になりました 。Googleは、このアーキテクチャによって「半分以下のメモリで、当社の26B MoE(専門家混合)モデルに迫るパフォーマンス」を実現し、かつ、わずか16GBのユニファイドメモリを搭載した一般消費者向けノートパソコンで動作すると主張しています
。
ベンチマークもこの自信を裏付けており、12Bモデルがその規模をはるかに超える実力を発揮していることを示しています。大学院レベルの推論能力を問うGPQA Diamondでは78.8という驚異的なスコアを叩き出し、26B版に肉薄します。学術的な多肢選択式ベンチマークのMMLU Proでは77.2%、競技数学のAIME 2026では77.5%を達成しました 。コード生成能力を測るLiveCodeBenchでは72.5%のスコアに達し、エージェンティックなワークフローや多段階推論における堅牢な実用能力を証明しています
。
製品群の最後を締めくくるのは、有料の文字起こしサービスに対する直接的な無料の代替手段として位置付けられる書き取りアプリ「Google AI Edge Eloquent」です 。このアプリはGemmaベースのモデルを搭載し、完全にオフラインファーストで動作するよう設計されています
。
単なる文字起こしを超え、自動音声推敲ツールとして機能する点がユニークです。「えーと」「あのー」といったフィラー(つなぎ言葉)を「積極的に削除」し、文法をその場で修正し、支離滅裂な生の会話を首尾一貫したプロフェッショナルなテキストへと再構築します 。これにより、単なるメモツールというより、コミュニケーションツールとしての性格を強めています。最大の差別化要因は価格です。サブスクリプション(定額課金)も使用量の上限も一切ありません
。macOS版には、macOS 13.0以降とApple M1チップ以降が必要ですが、App Storeのページには、一部の高度なオプション機能ではクラウド処理が必要になる場合があるとの注記もあります
。
今回の発表は、ローカルAIをめぐる二つの相反する哲学を浮き彫りにしました。Googleの戦略は、「壁の中の庭園」アプローチです。Googleが承認した厳選モデル群を、ブランド化された自社製アプリ(探索用のGallery、書き取り用のEloquent)と密接に統合し、統一推論エンジン(LiteRT-LM)をCLIとPython APIと共に提供します 。その目標は、箱から出してすぐに「魔法のように動く」、シームレスなコンシューマーグレードの体験を提供することです。
これは、最大限の柔軟性と選択肢を優先し、ユーザーが任意の互換モデルを自由に導入できる「開かれた図書館」としてのOllamaやLM Studioとは全く対照的です 。注目すべきは、OllamaもLM Studioも、すでにこのオープンウェイトのGemma 4 12Bモデルをサポートしている点です。つまり、Googleのモデルは自社スタック専用というわけではないのです
。
Googleの優位性は、ファーストパーティによる最適化にあります。自社モデルをApple Silicon上の自社推論エンジン向けに特別にチューニングすることで、より高いパフォーマンスと少ないメモリ使用量を実現しています。ユーザーにとってのトレードオフは明白です。より洗練され統合された体験が得られる一方で、Googleが厳選したGemmaファミリー以外のモデルを実行することはできません。これは、実験の自由よりも信頼性と使いやすさを重視するユーザーを取り込むための布陣であり、Mac上でのローカルAIの未来に、明確な分岐点を生み出そうとしています。
Comments
0 comments