当某个 Siri 请求过于复杂,无法在设备上处理时,苹果会转向云端——但并非随便什么云。根据《The Information》2026 年 5 月 28 日的报道,苹果会将部分 Siri 查询,交给运行在 Google Cloud 上一个授权版 Gemini 来处理 。苹果已批准在处理过程中启用英伟达机密计算,这是一项硬件级别的安全特性,可确保数据在 AI 推理时也保持加密状态
。
这标志着合作框架的一次重要演变。最初的理解是 Gemini 将仅运行在苹果自家的 PCC 基础设施内 。更新后的报道则澄清,苹果在自家内部服务器上高效运行完整的万亿参数模型时遇到了困难,因此转而向 Google Cloud 及英伟达寻求帮助,以处理部分云端查询
。关键在于,在此安排下,Google 不会保留用户数据
。
苹果在这笔交易中最具战略价值的部分,可能不是云端算力,而是模型蒸馏(knowledge distillation)。Google 给予苹果的,不是简单的 API 调用权限,而是对自家数据中心里完整 Gemini 模型的“完全访问权” 。这让苹果能够进行知识蒸馏:一个由庞大的 Gemini “教师”模型生成高质量回答并展现其内部推理步骤,再把这些知识用来训练一个体积小得多的**“学生”模型**的过程。这些“学生”模型最终会在苹果设备上本地运行
。
这些蒸馏出的模型针对苹果自研芯片(A 系列和 M 系列)做了深度优化,可以不依赖网络连接独立运算 。至关重要的一点是,“学生”模型学习模仿的是 Gemini 内在的运算逻辑,而不仅是表面的输出结果——这能锻造出比简单微调强大得多的设备端 AI 能力
。
这正是苹果设备端 AI 战略的核心:对日常查询,提供 Gemini 级别的推理能力,却无需将用户数据发送到任何云端服务器。
尽管目前对 Google Cloud 和英伟达芯片有了新的依赖,苹果并没有放弃私有云计算。在 2026 年第一财季的电话会议上,CEO 蒂姆·库克表示,新版 Siri 将“继续在设备上和私有云计算中运行”,并维持苹果“行业领先的隐私标准” 。
这里的品牌区分很关键:PCC 代表着苹果自有的基础设施,运行在 Apple Silicon 服务器上,采用无状态、临时性的计算方式,用户数据不会被存储,连苹果自己也接触不到 。而更新报道中利用英伟达机密计算的 Google Cloud,则是一个平行的、专用的云端层级——尽管在硬件层面同样保护隐私——但它与苹果最初描述的 PCC 架构有所不同
。
WWDC 2026 预计将是苹果有史以来最聚焦 AI 的开发者大会,Siri 的重塑会是全场焦点 。苹果的核心理念将强调:绝大多数 Siri 查询都由蒸馏出的“学生”模型在设备端处理,提供即时响应、离线可用,和百分之百的数据隐私
。
根据多份报告,苹果还将随 iOS 27 发布一个名为“扩展(Extensions)”的框架,允许用户为特定任务选择默认的 AI 引擎(如 Gemini、ChatGPT 或 Claude),而 Apple Intelligence 则会作为默认的、隐私优先的第一层 。Siri 本身也被彻底重建为一个 真正的聊天机器人,它拥有独立 App、类似 iMessage 的对话界面以及与灵动岛的深度整合
。
关于信息来源的一点说明: 最新细节——尤其是苹果在 Google Cloud 中使用英伟达机密计算——源自《The Information》2026 年 5 月 28 日的独家报道。虽然该媒体信誉良好,但这仍是单一信源的进展。故事的其余部分,包括每年 10 亿美元的合作结构、模型蒸馏权利以及 PCC 架构,均得到了苹果财报电话会议、Google 与苹果的联合声明以及彭博社等其他多家独立报道的佐证。
Comments
0 comments