RespostasPublicadohá 2 mesesLast edited mês passado35 fontes

Por Dentro da Nova Siri: Como a Apple Está Usando Google Gemini, Chips Nvidia e IA Local para Reinventar a Assistente

A estratégia da Siri para 2026 combina um modelo Gemini customizado de 1,2 trilhão de parâmetros, IA no dispositivo via destilação de conhecimento e computação confidencial da Nvidia no Google Cloud, tudo unificado so... O acordo de US$ 1 bilhão por ano dá à Apple acesso completo ao modelo Gemini para destilação, cr...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

Apple Siri and Google Gemini AI integration concept illustration with privacy and cloud computing motifs — What is Apple's strategy for integrating Google's Gemini model into its Siri overhaul — including its use of Nvidia confidential computing iApple's 2026 Siri strategy combines Google's Gemini model with on-device AI and Nvidia confidential computing, all framed around privacy.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What is Apple's strategy for integrating Google's Gemini model into its Siri overhaul — including its use of Nvidia confidential computing i. Article summary: Apple's Gemini-powered Siri strategy is a three-tier architecture combining on-device distillation, Private Cloud Compute (PCC) with Nvidia confidential computing on Google Cloud, and a massive foundational model license. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Per reporting by The Information, Apple will run some user queries to a new Siri in Google Cloud on a licensed version of Google's Gemini model," source context "Apple Integrates Google Gemini, Uses Nvidia Chips | Let's Data Science" Reference image 2: visual subject "Apple Will Use Google Gemini AI to Power Next
openai.com

A tão esperada reformulação da Siri pela Apple não é uma simples atualização de chatbot. Trata-se de uma reestruturação completa de sua arquitetura, baseada em uma pilha de IA de três camadas: modelos destilados no dispositivo, Private Cloud Compute (PCC), e um enorme modelo licenciado do Gemini rodando no Google Cloud com computação confidencial da Nvidia. Todo o projeto é construído em torno do pilar da privacidade, e está pronto para ser a grande estrela da WWDC 2026.

A Parceria de US$ 1 Bilhão

Em 12 de janeiro de 2026, Apple e Google anunciaram uma colaboração plurianual avaliada em cerca de US$ 1 bilhão por ano. O ponto central do acordo: a nova geração dos Apple Foundation Models (codinome AFM v10) é construída sobre um modelo Gemini customizado de 1,2 trilhão de parâmetros — algo em torno de oito vezes maior do que os modelos de IA em nuvem usados anteriormente pela Apple . As duas empresas afirmaram que esses modelos impulsionarão os futuros recursos do Apple Intelligence, incluindo uma Siri mais personalizada que chegará no final de 2026 .

Diferentemente da atual integração com o ChatGPT, que explicitamente redireciona perguntas complexas para a OpenAI com uma marca visível, a Siri com Gemini operará de forma invisível em segundo plano. A experiência permanece sem qualquer menção à marca Google — os usuários verão simplesmente "Siri" .

Computação Confidencial da Nvidia no Google Cloud

Quando uma pergunta feita à Siri é complexa demais para o processamento local no dispositivo, a Apple recorre à nuvem — mas não a qualquer nuvem. De acordo com uma reportagem de 28 de maio de 2026 do The Information, a Apple executará algumas consultas da Siri em uma versão licenciada do Gemini dentro do Google Cloud . A Apple aprovou o uso da computação confidencial da Nvidia para esse processamento em nuvem, um recurso de segurança em nível de hardware que mantém os dados criptografados até mesmo durante a inferência da IA .

Isso marca uma evolução significativa em relação ao formato original do acordo. Inicialmente, acreditava-se que o Gemini rodaria exclusivamente dentro da infraestrutura do PCC da própria Apple . As reportagens mais recentes esclarecem que a Apple encontrou dificuldades para fazer o modelo completo de mais de um trilhão de parâmetros funcionar de forma eficiente em seus servidores internos e, por isso, recorreu ao Google Cloud com a assistência da Nvidia para algumas consultas . É importante ressaltar que, nesse acordo, os dados do usuário não são retidos pelo Google .

Destilação de Modelos: Ensinando 'Modelos Alunos' Menores

A vantagem estratégica mais poderosa da Apple nesse acordo não é o acesso à nuvem — é a destilação de modelos. O Google concedeu à Apple "acesso completo" ao modelo Gemini dentro de seus próprios data centers, e não simplesmente um acesso via API . A Apple pode usar esse acesso para realizar a destilação de conhecimento: um processo em que o grande modelo Gemini "professor" gera respostas de alta qualidade e revela etapas de raciocínio internas, que são então usadas para treinar "modelos alunos" muito menores, capazes de rodar localmente nos dispositivos da Apple .

Esses modelos destilados são otimizados para o silício customizado da Apple (chips da série A e M) e podem operar sem conexão com a internet . Crucialmente, os modelos alunos aprendem a imitar as computações internas do Gemini, não apenas seus resultados superficiais — produzindo uma IA no dispositivo muito mais capaz do que seria possível por meio de um simples ajuste fino .

Este é o núcleo da estratégia de IA no dispositivo da Apple: oferecer um raciocínio em nível de Gemini para perguntas cotidianas, sem enviar nenhum dado do usuário para servidores na nuvem.

A Marca 'Private Cloud Compute' Continua

Apesar da nova dependência do Google Cloud e dos chips Nvidia para algumas consultas, a Apple não está abandonando o Private Cloud Compute. Na teleconferência de resultados do primeiro trimestre fiscal de 2026, o CEO Tim Cook afirmou que a nova Siri "continuará rodando no dispositivo e no Private Cloud Compute", mantendo os "padrões de privacidade líderes da indústria" da Apple .

A distinção da marca PCC é importante: ela representa a infraestrutura própria da Apple, rodando em servidores com Apple Silicon com computação efêmera e sem estado, onde os dados do usuário nunca são armazenados ou acessíveis, nem mesmo pela Apple . O novo acordo com o Google Cloud usando computação confidencial da Nvidia opera como um nível de nuvem especializado e paralelo — ainda protegido em nível de hardware —, mas distinto da arquitetura PCC originalmente descrita pela Apple .

WWDC 2026: Privacidade como o Grande Diferencial

Espera-se que a WWDC 2026 seja a conferência de desenvolvedores da Apple mais focada em IA até hoje, com a reformulação da Siri ocupando o centro do palco . A mensagem da Apple enfatizará que a maioria das perguntas feitas à Siri será processada no dispositivo, por modelos alunos destilados, proporcionando respostas instantâneas, operação offline e total privacidade dos dados .

De acordo com vários relatórios, a Apple também anunciará um framework de "Extensões" no iOS 27, que permitirá aos usuários escolher seu motor de IA padrão (Gemini, ChatGPT ou Claude) para tarefas específicas, enquanto o Apple Intelligence permanecerá como a camada padrão focada em privacidade . A própria Siri está sendo reconstruída como um chatbot completo, com um aplicativo independente, interface de bate-papo no estilo do iMessage e integração com a Ilha Dinâmica (Dynamic Island) .

A principal vantagem competitiva que a Apple planeja destacar é: o processamento no dispositivo significa que, para a grande maioria das perguntas, os dados do usuário nunca saem do aparelho — uma afirmação que assistentes puramente baseados na nuvem não podem fazer .

Uma nota sobre as fontes: Os detalhes mais recentes — especificamente o uso da computação confidencial da Nvidia dentro do Google Cloud — vêm do The Information (28 de maio de 2026). Embora o veículo seja confiável, essa informação depende de uma única reportagem. As partes anteriores da história, incluindo a estrutura do acordo de US$ 1 bilhão, os direitos de destilação e a arquitetura do PCC, são corroboradas pelas declarações da própria Apple em sua teleconferência de resultados, pelo anúncio conjunto do Google e Apple, e por múltiplas reportagens independentes da Bloomberg e outros veículos.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "Por Dentro da Nova Siri: Como a Apple Está Usando Google Gemini, Chips Nvidia e IA Local para Reinventar a Assistente" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Fontes

← Back to Trending