Ist eine Siri-Anfrage zu komplex für die Verarbeitung auf dem Gerät, weicht Apple in die Cloud aus – aber nicht in irgendeine Cloud. Laut einem Bericht von The Information vom 28. Mai 2026 wird Apple einige Siri-Anfragen mit einer lizenzierten Version von Gemini innerhalb der Google Cloud ausführen . Apple hat für diese Cloud-Verarbeitung den Einsatz von Nvidias Confidential Computing genehmigt, einer Sicherheitsfunktion auf Hardware-Ebene, die Daten selbst während der KI-Inferenz verschlüsselt hält
.
Dies bedeutet eine bedeutende Weiterentwicklung im Vergleich zur ursprünglichen Ankündigung. Zunächst hieß es, Gemini würde exklusiv innerhalb von Apples eigener PCC-Infrastruktur laufen . Neuere Berichte stellen klar, dass Apple Schwierigkeiten hatte, das volle, Billionen-Parameter-starke Modell effizient auf den eigenen Servern zu betreiben, und sich daher für einige Cloud-Anfragen an Google Cloud und Nvidia wendet
. Entscheidend ist: Google speichert bei diesem Vorgang keine Nutzerdaten
.
Apples größter strategischer Vorteil in diesem Deal ist nicht der Cloud-Zugang – es ist die Modelldestillation. Google hat Apple „vollständigen Zugriff“ auf das vollständige Gemini-Modell in seinen eigenen Rechenzentren gewährt, nicht lediglich API-Zugriff . Apple kann diesen Zugang für die Wissensdestillation nutzen: ein Prozess, bei dem das große Gemini-„Lehrer“-Modell qualitativ hochwertige Antworten generiert und interne Denkschritte offenlegt. Diese werden dann genutzt, um viel kleinere „Schüler“-Modelle zu trainieren, die lokal auf Apple-Geräten laufen
.
Diese destillierten Modelle sind für Apples eigene Prozessoren optimiert (A-Serie und M-Serie Chips) und funktionieren ohne Internetverbindung . Entscheidend ist, dass die Schüler-Modelle lernen, die internen Berechnungen von Gemini zu imitieren, nicht nur dessen oberflächliche Ausgaben – was zu einer leistungsfähigeren KI auf dem Gerät führt, als es durch einfaches Fine-Tuning möglich wäre
.
Dies ist der Kern von Apples On-Device-KI-Strategie: Gemini-ähnliche Denkfähigkeit für Alltagsanfragen, ohne dass Nutzerdaten an einen Cloud-Server gesendet werden müssen.
Trotz der neuen Abhängigkeit von Google Cloud und Nvidia-Chips für einige Anfragen rückt Apple nicht von Private Cloud Compute ab. In Apples Telefonkonferenz zu den Ergebnissen des ersten Quartals 2026 erklärte CEO Tim Cook, dass das neue Siri „weiterhin auf dem Gerät und in Private Cloud Compute laufen“ und dabei Apples „branchenführende Datenschutzstandards“ wahren werde .
Diese begriffliche Unterscheidung ist wichtig: PCC repräsentiert Apples eigene Infrastruktur, die auf Apple-Silicon-Servern mit zustandsloser, kurzlebiger Berechnung läuft, bei der Nutzerdaten niemals gespeichert oder selbst für Apple zugänglich sind . Die neuere Google-Cloud-Vereinbarung mit Nvidias vertraulicher Datenverarbeitung fungiert als eine parallele, spezialisierte Cloud-Stufe – ebenfalls datenschutzgeschützt auf Hardware-Ebene – aber klar getrennt von der ursprünglich von Apple beschriebenen PCC-Architektur
.
Die WWDC 2026 wird voraussichtlich Apples bisher KI-fokussierteste Entwicklerkonferenz sein, mit Siri im Mittelpunkt . Apples Botschaft wird betonen, dass die meisten Siri-Anfragen auf dem Gerät von destillierten Schüler-Modellen verarbeitet werden, was sofortige Antworten, Offline-Betrieb und vollständige Datensouveränität ermöglicht
.
Mehreren Berichten zufolge wird Apple in iOS 27 auch ein „Extensions“-Framework ankündigen, mit dem Nutzer ihre Standard-KI-Engine (Gemini, ChatGPT oder Claude) für bestimmte Aufgaben auswählen können, während Apple Intelligence die datenschutzfreundliche Standardeinstellung bleibt . Siri selbst wird zu einem vollwertigen Chatbot mit eigener App, Chat-Oberfläche im iMessage-Stil und Integration in die Dynamic Island umgebaut
.
Der entscheidende Wettbewerbsvorteil, den Apple hervorheben will: On-Device-Verarbeitung bedeutet, dass Nutzerdaten für die allermeisten Anfragen das Gerät nie verlassen – eine Behauptung, die rein cloudbasierte Assistenten nicht aufstellen können .
Ein Hinweis zu den Quellen: Die aktuellsten Details – insbesondere Apples Nutzung von Nvidias Confidential Computing in der Google Cloud – stammen von The Information (28. Mai 2026). Obwohl das Medium glaubwürdig ist, handelt es sich um eine Einzelberichterstattung. Die früheren Teile der Geschichte, einschließlich der Deal-Struktur über 1 Mrd. USD, der Destillationsrechte und der PCC-Architektur, werden durch Apples eigene Aussagen bei der Telefonkonferenz, die gemeinsame Ankündigung von Google und Apple sowie mehrere unabhängige Berichte, unter anderem von Bloomberg, bestätigt.
Comments
0 comments