Khi một yêu cầu Siri quá phức tạp để xử lý trên thiết bị, Apple chuyển sang đám mây – nhưng không phải bất kỳ đám mây nào. Theo một báo cáo ngày 28 tháng 5 năm 2026 từ The Information, Apple sẽ chạy một số truy vấn Siri trên một phiên bản Gemini được cấp phép bên trong Google Cloud . Apple đã phê duyệt việc sử dụng điện toán bảo mật của Nvidia cho quá trình xử lý đám mây đó, một tính năng bảo mật cấp độ phần cứng giúp dữ liệu được mã hóa ngay cả trong quá trình suy luận AI
.
Điều này đánh dấu một bước tiến hóa đáng kể so với khuôn khổ ban đầu của thỏa thuận. Lúc đầu, người ta hiểu rằng Gemini sẽ chạy độc quyền bên trong cơ sở hạ tầng PCC của chính Apple . Báo cáo mới hơn làm rõ rằng Apple đã gặp khó khăn trong việc vận hành hiệu quả mô hình đầy đủ hơn một nghìn tỷ tham số trên các máy chủ nội bộ của mình và giờ đây đã tìm đến Google Cloud với sự trợ giúp của Nvidia cho một số truy vấn đám mây
. Điều quan trọng cần lưu ý là trong thỏa thuận này, dữ liệu người dùng không bị Google giữ lại
.
Lợi thế chiến lược nhất của Apple trong thỏa thuận này không phải là quyền truy cập đám mây – mà là chưng cất mô hình. Google đã trao cho Apple "quyền truy cập hoàn chỉnh" vào mô hình Gemini đầy đủ bên trong các trung tâm dữ liệu của chính mình, chứ không chỉ đơn thuần là quyền truy cập cấp API . Apple có thể sử dụng quyền truy cập đó để thực hiện chưng cất tri thức: một quá trình mà mô hình Gemini "giáo viên" lớn tạo ra các phản hồi chất lượng cao và tiết lộ các bước suy luận nội bộ, sau đó được sử dụng để đào tạo các mô hình "học sinh" nhỏ hơn nhiều, có thể chạy cục bộ trên các thiết bị Apple
.
Những mô hình chưng cất này được tối ưu hóa cho chip tùy chỉnh của Apple (dòng A-series và M-series) và có thể hoạt động mà không cần kết nối internet . Điểm mấu chốt là các mô hình 'học sinh' học cách bắt chước các tính toán nội bộ của Gemini, chứ không chỉ các kết quả đầu ra bề mặt – tạo ra AI trên thiết bị có năng lực hơn nhiều so với khả năng thông qua tinh chỉnh thông thường
. Nói một cách dễ hiểu, Apple đang 'chưng cất' tinh hoa trí tuệ từ 'người thầy' Gemini khổng lồ để rót vào những 'cỗ máy' nhỏ gọn trong iPhone, iPad.
Đây chính là cốt lõi của chiến lược AI trên thiết bị của Apple: khả năng suy luận cấp độ Gemini cho các truy vấn hàng ngày mà không cần gửi dữ liệu người dùng đến bất kỳ máy chủ đám mây nào.
Bất chấp sự phụ thuộc mới vào Google Cloud và chip Nvidia cho một số truy vấn, Apple không từ bỏ Private Cloud Compute. Trong cuộc gọi thu nhập quý 1 năm 2026 của Apple, CEO Tim Cook tuyên bố rằng Siri mới sẽ "tiếp tục chạy trên thiết bị và trong Private Cloud Compute" trong khi vẫn duy trì "tiêu chuẩn bảo mật hàng đầu ngành" của Apple .
Sự khác biệt về thương hiệu rất quan trọng: PCC đại diện cho cơ sở hạ tầng riêng của Apple, chạy trên các máy chủ Apple Silicon với khả năng tính toán tạm thời, không lưu trạng thái, nơi dữ liệu người dùng không bao giờ được lưu trữ hoặc có thể truy cập ngay cả bởi Apple . Thỏa thuận Google Cloud mới hơn sử dụng điện toán bảo mật của Nvidia hoạt động như một tầng đám mây chuyên biệt, song song – vẫn được bảo vệ quyền riêng tư ở cấp độ phần cứng – nhưng khác biệt với kiến trúc PCC mà Apple mô tả ban đầu
.
WWDC 2026 được kỳ vọng là hội nghị nhà phát triển tập trung vào AI nhất từ trước đến nay của Apple, với thiết kế lại Siri chiếm vị trí trung tâm . Thông điệp của Apple sẽ nhấn mạnh rằng hầu hết các truy vấn Siri được xử lý trên thiết bị bởi các mô hình "học sinh" chưng cất, mang lại phản hồi tức thì, khả năng hoạt động ngoại tuyến và quyền riêng tư dữ liệu hoàn chỉnh
.
Theo nhiều báo cáo, Apple cũng sẽ công bố một khuôn khổ "Tiện ích mở rộng" (Extensions) trong iOS 27 cho phép người dùng chọn công cụ AI mặc định của họ (Gemini, ChatGPT hoặc Claude) cho các tác vụ cụ thể, trong khi Apple Intelligence vẫn là lớp ưu tiên quyền riêng tư mặc định . Bản thân Siri đang được xây dựng lại thành một chatbot đầy đủ với một ứng dụng độc lập, giao diện trò chuyện kiểu iMessage và tích hợp Dynamic Island
.
Lợi thế cạnh tranh chính mà Apple dự định nhấn mạnh: xử lý trên thiết bị có nghĩa là dữ liệu người dùng không bao giờ rời khỏi thiết bị cho phần lớn các truy vấn – một tuyên bố mà các trợ lý thuần điện toán đám mây không thể sánh được .
Lưu ý về nguồn tin: Các chi tiết gần đây nhất – cụ thể là việc Apple sử dụng điện toán bảo mật của Nvidia bên trong Google Cloud – đến từ The Information (ngày 28 tháng 5 năm 2026). Mặc dù đây là một tờ báo đáng tin cậy, nhưng diễn biến này mới chỉ dựa trên một báo cáo duy nhất. Các phần trước đó của câu chuyện, bao gồm cấu trúc thỏa thuận 1 tỷ USD, quyền chưng cất và kiến trúc PCC, được chứng thực bởi chính các tuyên bố của Apple trong cuộc gọi thu nhập, thông cáo chung của Google-Apple và nhiều báo cáo độc lập từ Bloomberg và các nguồn khác.
Comments
0 comments