Lorsqu'une requête Siri est trop complexe pour être traitée directement sur l'appareil, Apple se tourne vers le cloud – mais pas n'importe lequel. Selon un rapport du média The Information du 28 mai 2026, Apple exécutera certaines requêtes Siri sur une version sous licence de Gemini hébergée dans Google Cloud . Apple a validé l'utilisation du calcul confidentiel Nvidia pour ce traitement cloud, une fonction de sécurité au niveau matériel qui garde les données chiffrées même pendant l'inférence de l'IA
.
Cette approche marque une évolution notable par rapport à la vision initiale de ce partenariat. Au départ, on pensait que Gemini fonctionnerait exclusivement au sein de l'infrastructure PCC d'Apple . Des informations plus récentes précisent qu'Apple a rencontré des difficultés à faire fonctionner efficacement l'intégralité du modèle à mille milliards de paramètres sur ses propres serveurs internes, et s'est donc tourné vers Google Cloud avec l'aide de Nvidia pour certaines requêtes
. Il est capital de noter que, selon les termes de l'accord, Google ne conserve aucune donnée utilisateur
.
L'avantage stratégique le plus important d'Apple dans cet accord n'est pas l'accès au cloud, mais bien la distillation de modèles. Google a accordé à Apple un « accès complet » au modèle Gemini dans ses propres centres de données, et non un simple accès par API . Apple peut utiliser cet accès pour pratiquer la distillation de connaissances : un processus où le grand modèle Gemini « professeur » génère des réponses de haute qualité et dévoile ses étapes de raisonnement internes. Ces informations sont ensuite utilisées pour entraîner des modèles « élèves » bien plus compacts, capables de fonctionner en local sur les appareils Apple
.
Ces modèles distillés sont optimisés pour les puces Apple (les gammes A et M) et peuvent fonctionner sans connexion internet . Point crucial, ces modèles élèves apprennent à imiter les calculs internes de Gemini, et pas seulement leurs résultats finaux – ce qui permet de créer une IA embarquée bien plus performante que ce qu'un simple ajustement fin aurait permis
.
C'est le cœur de la stratégie d'IA locale d'Apple : offrir un raisonnement de niveau Gemini pour les requêtes du quotidien, sans jamais envoyer les données utilisateur vers un serveur cloud.
Malgré cette nouvelle dépendance à Google Cloud et aux puces Nvidia pour certaines requêtes, Apple n'abandonne pas sa marque Private Cloud Compute. Lors de l'appel aux résultats du premier trimestre 2026, le PDG Tim Cook a affirmé que le nouveau Siri « continuera de fonctionner sur l'appareil et via Private Cloud Compute », tout en maintenant les « standards de confidentialité parmi les plus élevés de l'industrie » .
La distinction de marque est importante : le PCC représente l'infrastructure propre d'Apple, fonctionnant sur des serveurs Apple Silicon avec un calcul sans état et éphémère, où les données utilisateur ne sont jamais stockées ni accessibles, même par Apple . Le nouvel arrangement avec Google Cloud et le calcul confidentiel Nvidia fonctionne comme un niveau cloud parallèle et spécialisé – toujours protégé au niveau matériel sur le plan de la confidentialité – mais distinct de l'architecture PCC initialement décrite par Apple
.
La WWDC 2026 s'annonce comme la conférence des développeurs la plus centrée sur l'IA de l'histoire d'Apple, avec la refonte de Siri en vedette . Le message d'Apple mettra l'accent sur le fait que la plupart des requêtes Siri sont traitées localement par des modèles élèves distillés, offrant des réponses instantanées, un fonctionnement hors ligne et une confidentialité totale des données
.
Selon plusieurs rapports, Apple annoncera également dans iOS 27 un framework « Extensions » permettant aux utilisateurs de choisir leur moteur d'IA par défaut (Gemini, ChatGPT ou Claude) pour des tâches spécifiques, tandis qu'Apple Intelligence restera la couche par défaut, respectueuse de la vie privée . Siri lui-même est en train d'être reconstruit comme un chatbot complet avec une application dédiée, une interface de chat façon iMessage et une intégration à la Dynamic Island
.
L'avantage concurrentiel clé qu'Apple compte souligner : le traitement sur l'appareil signifie que les données de l'utilisateur ne quittent jamais l'iPhone pour la grande majorité des requêtes – un argument que les assistants purement basés sur le cloud ne peuvent tout simplement pas avancer .
Note sur les sources : Les détails les plus récents, en particulier l'utilisation par Apple du calcul confidentiel Nvidia au sein de Google Cloud, proviennent d'un article de The Information (28 mai 2026), un média jugé crédible mais dont l'information n'a pas encore été recoupée. Les éléments antérieurs, incluant la structure de l'accord à 1 milliard de dollars, les droits de distillation et l'architecture PCC, sont corroborés par les déclarations d'Apple lors de ses appels aux résultats, l'annonce conjointe Google-Apple et plusieurs rapports indépendants de Bloomberg et d'autres sources.
Comments
0 comments