Quando uma pergunta feita à Siri é complexa demais para o processamento local no dispositivo, a Apple recorre à nuvem — mas não a qualquer nuvem. De acordo com uma reportagem de 28 de maio de 2026 do The Information, a Apple executará algumas consultas da Siri em uma versão licenciada do Gemini dentro do Google Cloud . A Apple aprovou o uso da computação confidencial da Nvidia para esse processamento em nuvem, um recurso de segurança em nível de hardware que mantém os dados criptografados até mesmo durante a inferência da IA
.
Isso marca uma evolução significativa em relação ao formato original do acordo. Inicialmente, acreditava-se que o Gemini rodaria exclusivamente dentro da infraestrutura do PCC da própria Apple . As reportagens mais recentes esclarecem que a Apple encontrou dificuldades para fazer o modelo completo de mais de um trilhão de parâmetros funcionar de forma eficiente em seus servidores internos e, por isso, recorreu ao Google Cloud com a assistência da Nvidia para algumas consultas
. É importante ressaltar que, nesse acordo, os dados do usuário não são retidos pelo Google
.
A vantagem estratégica mais poderosa da Apple nesse acordo não é o acesso à nuvem — é a destilação de modelos. O Google concedeu à Apple "acesso completo" ao modelo Gemini dentro de seus próprios data centers, e não simplesmente um acesso via API . A Apple pode usar esse acesso para realizar a destilação de conhecimento: um processo em que o grande modelo Gemini "professor" gera respostas de alta qualidade e revela etapas de raciocínio internas, que são então usadas para treinar "modelos alunos" muito menores, capazes de rodar localmente nos dispositivos da Apple
.
Esses modelos destilados são otimizados para o silício customizado da Apple (chips da série A e M) e podem operar sem conexão com a internet . Crucialmente, os modelos alunos aprendem a imitar as computações internas do Gemini, não apenas seus resultados superficiais — produzindo uma IA no dispositivo muito mais capaz do que seria possível por meio de um simples ajuste fino
.
Este é o núcleo da estratégia de IA no dispositivo da Apple: oferecer um raciocínio em nível de Gemini para perguntas cotidianas, sem enviar nenhum dado do usuário para servidores na nuvem.
Apesar da nova dependência do Google Cloud e dos chips Nvidia para algumas consultas, a Apple não está abandonando o Private Cloud Compute. Na teleconferência de resultados do primeiro trimestre fiscal de 2026, o CEO Tim Cook afirmou que a nova Siri "continuará rodando no dispositivo e no Private Cloud Compute", mantendo os "padrões de privacidade líderes da indústria" da Apple .
A distinção da marca PCC é importante: ela representa a infraestrutura própria da Apple, rodando em servidores com Apple Silicon com computação efêmera e sem estado, onde os dados do usuário nunca são armazenados ou acessíveis, nem mesmo pela Apple . O novo acordo com o Google Cloud usando computação confidencial da Nvidia opera como um nível de nuvem especializado e paralelo — ainda protegido em nível de hardware —, mas distinto da arquitetura PCC originalmente descrita pela Apple
.
Espera-se que a WWDC 2026 seja a conferência de desenvolvedores da Apple mais focada em IA até hoje, com a reformulação da Siri ocupando o centro do palco . A mensagem da Apple enfatizará que a maioria das perguntas feitas à Siri será processada no dispositivo, por modelos alunos destilados, proporcionando respostas instantâneas, operação offline e total privacidade dos dados
.
De acordo com vários relatórios, a Apple também anunciará um framework de "Extensões" no iOS 27, que permitirá aos usuários escolher seu motor de IA padrão (Gemini, ChatGPT ou Claude) para tarefas específicas, enquanto o Apple Intelligence permanecerá como a camada padrão focada em privacidade . A própria Siri está sendo reconstruída como um chatbot completo, com um aplicativo independente, interface de bate-papo no estilo do iMessage e integração com a Ilha Dinâmica (Dynamic Island)
.
A principal vantagem competitiva que a Apple planeja destacar é: o processamento no dispositivo significa que, para a grande maioria das perguntas, os dados do usuário nunca saem do aparelho — uma afirmação que assistentes puramente baseados na nuvem não podem fazer .
Uma nota sobre as fontes: Os detalhes mais recentes — especificamente o uso da computação confidencial da Nvidia dentro do Google Cloud — vêm do The Information (28 de maio de 2026). Embora o veículo seja confiável, essa informação depende de uma única reportagem. As partes anteriores da história, incluindo a estrutura do acordo de US$ 1 bilhão, os direitos de destilação e a arquitetura do PCC, são corroboradas pelas declarações da própria Apple em sua teleconferência de resultados, pelo anúncio conjunto do Google e Apple, e por múltiplas reportagens independentes da Bloomberg e outros veículos.
Comments
0 comments