虽然该应用现已覆盖macOS、iOS和安卓,但macOS版本凸显了其独特的模型策略 。与Ollama和LM Studio那种允许用户随心拉取任何兼容模型的“开放货架”式做法不同,苹果电脑上的AI Edge Gallery目前只展示了五款由谷歌亲自挑选的Gemma模型
。据科技媒体9to5Mac报道,可选模型包括Gemma-4-12B-it、Gemma-4-E2B-it、Gemma-4-E4B-it、一款Gemma-4 26B的变体,以及FunctionGemma-270M
。这种精挑细选,正是谷歌这套打法的核心:一个受控的、品质有保障的封闭环境
。
支撑整个AI Edge体验的幕后引擎是谷歌自家的LiteRT-LM推理框架,它支持CPU、GPU和NPU多种后端,覆盖Linux、macOS和Windows系统 。官方的性能标杆是体积为2.58GB的Gemma-4-E2B模型,在MacBook Pro M4上的表现相当亮眼
:
启用GPU加速后那巨大的速度飞跃,说明谷歌的软件栈针对苹果芯片的Metal API做了深度调优,带来了几乎瞬时响应、极为流畅的用户体验。
在Apache 2.0开源协议下发布的Gemma 4 12B,是这次发布的绝对主角 。它最大的不同在于架构。这是一个稠密的、decoder-only的Transformer,采用了与体积大得多的Gemma 4 31B Dense模型相同的先进解码器结构
。
其最关键的技术创新则是**“去编码器”的多模态设计**。传统多模态模型,都需要借助庞大、独立的视觉编码器(如ViT)和音频编码器(如conformer层)来分别处理图像和声音,再“翻译”给核心的语言模型 。但Gemma 4 12B一股脑地把它们全扔掉了
。它选择了一种更轻巧的路线:
如此一来,这个模型就能在原生的单一流程中理解文本、图像、音频和视频 。谷歌宣称,这种架构让它“性能接近我们的26B MoE模型,而内存占用还不到后者的一半”,并且能在仅有16GB统一内存的消费级笔记本上跑起来
。
一系列基准测试也证实了这股自信,12B的小身板跑出了远超同级的成绩。在研究生水平的推理基准测试GPQA Diamond上,它取得了惊人的78.8分,直逼26B的变体。在学术风格的多选题测试MMLU Pro中,它拿到了77.2%的高分;在竞争激烈的数学基准测试AIME 2026中,分数也达到了77.5% 。在代码生成的LiveCodeBench测试中,其72.5%的得分也展示了它在自主工作流和多步推理中的强悍实操能力
。
它不仅仅是在做简单的语音转录,更像一个全自动的演讲润色师。它会“毫不留情地”砍掉“嗯”、“啊”这样的填充词,即时修正语法错误,将杂乱的原始口语编排成通顺、专业的书面表达 。这让它超越了笔记工具,更像一个沟通利器。而真正让它变得迷人之处在于价格:没有订阅费,也没有使用次数限制
。macOS版本要求系统不低于macOS 13.0,且需配备苹果M1或更新芯片的设备。不过注意,应用商店页面提到,部分高级可选功能可能仍需要云端处理
。
这次发布,正式在本地AI领域划下了两种截然不同的路线。谷歌的路线是**“围墙花园”**:一个由其官方把关的精选模型集,与第一方品牌应用(AI Gallery负责体验,Eloquent负责听写)紧密绑定,并由统一的推理引擎LiteRT-LM(及其命令行和Python API)驱动 。其终极目标是提供一个无缝衔接、“开箱即用”的消费级体验。
这与Ollama和LM Studio形成了鲜明对比。这两位更像“开源大卖场”,把最大限度提供灵活性和选择权放在首位,允许用户拉取任何兼容的开源模型来跑 。值得一提的是,这两家早已支持同样开源的Gemma 4 12B模型,说明谷歌的这把利刃并非自家平台独占
。
谷歌的优势在于第一方优化——其模型与其推理引擎在苹果芯片上经过深度磨合,能跑出更好的性能、更低的内存占用。而用户要做的选择题也很清楚了:你用选择权和折腾的自由,换来了一个更精致、更整合的本地AI体验,但同时也被牢牢锁在了谷歌Gemma家族的“货架”里。对于那些看重可靠与易用、而非折腾乐趣的用户来说,这或许是Mac上本地AI的一条全新分岔路。
Comments
0 comments