Es geht nicht um einen simplen Entscheidungsbaum basierend auf Dateigröße oder Aufgabentyp. Srinivas erklärte, der Orchestrator „überlege in Echtzeit, welche Arbeit auf dem Gerät laufen sollte und welche an Agenten in der Cloud gehen kann“ .
Die Ankündigung auf der Computex hob mehrere Kernfähigkeiten hervor, die diesen Orchestrator für Unternehmen attraktiv machen:
Chipunabhängig („Chip Agnostic“) als Konzept
Obwohl die Bühnendemo exklusiv auf Intel-Hardware lief, betonten Srinivas und Perplexity, dass der Orchestrator nicht an das Intel-Ökosystem gebunden ist. In einem Interview nach der Keynote bezeichnete Srinivas die Plattform explizit als „chip agnostic“ und erklärte, sie sei so konzipiert, dass sie mit Silizium verschiedener Anbieter funktioniert . Der anfängliche Start auf Intel-betriebenen Windows-PCs ist ein Meilenstein der Partnerschaft, keine dauerhafte Einschränkung
.
Massive Multi-Modell-Orchestrierung
Der Orchestrator arbeitet innerhalb von Perplexitys breiterem KI-Betriebssystem „Computer“, das bis zu 20 verschiedene KI-Modelle gleichzeitig koordinieren kann. Für jede Teilaufgabe wählt das System das optimale Modell nach Leistungsfähigkeit, Geschwindigkeit und Kosten aus – und stellt so sicher, dass man nicht mit Kanonen auf Spatzen schießt .
Eine echte Datenschutz-Firewall
Für regulierte Branchen wie das Finanzwesen oder das Gesundheitswesen ist es nicht verhandelbar, sensible Daten auf fremde Cloud-Server zu schicken. Der Orchestrator fungiert als Datenschutz-Torwächter: Compliance-relevante Dokumente werden lokal analysiert, bevor nicht-sensible Kontexte zur Anreicherung in die Cloud übermittelt werden .
Deutliche Kostenreduktion
Jede KI-Anfrage in Unternehmen über ein Cloud-Frontier-Modell laufen zu lassen, wird zunehmend unerschwinglich. Durch das intelligente Auslagern einfacher oder privater Aufgaben auf die lokalen KI-Recheneinheiten (NPU) schätzen Beobachter, dass sich die Inferenzkosten um 30 bis 50 Prozent senken lassen .
Die Live-Demo auf der Computex zeigte einen Laptop mit Intels neuem Core Ultra Series 3 Prozessor, der auf dem fortschrittlichen 18A-Fertigungsprozess des Unternehmens basiert . In der Vorführung lud ein Private-Equity-Analyst ein vertrauliches Projekt namens „Project Falcon“ – inklusive Geheimhaltungsvereinbarungen, Finanzmodellen und vertraulicher Gesprächsprotokolle. Die lokale Intel-Hardware übernahm die Analyse der sensiblen Dokumente, während Cloud-Agenten parallel externe Marktforschung betrieben, ohne dass private Daten das Gerät verließen
.
Intel wertete die Zusammenarbeit als Bestätigung dafür, dass geräteinterne KI kein Spielzeug mehr ist. Die integrierte GPU und NPU der Core Ultra Series 3 können anspruchsvolle KI-Arbeitslasten bewältigen, die bislang Rechenzentren vorbehalten waren, und ermöglichen so eine echte Arbeitsteilung, die den „Token-Wert pro Watt maximiert“ . Zum Marktstart ist die hybride Inferenz-Funktion exklusiv der Perplexity-App auf Intel-betriebenen Windows-PCs vorbehalten, aber die zugrundeliegende Architektur des Orchestrators ist auf eine viel breitere Hardware-Unterstützung ausgelegt
.
Die Perplexity-Intel-Demo war kein isoliertes Experiment, sondern die Leitankündigung eines dominierenden Themas der Computex 2026: die Verteilung von KI-Arbeitslasten zwischen Endgerät und Cloud.
Intel nutzte seine gesamte Computex-Keynote, um diese verteilte Zukunft zu bekräftigen, und kündigte ergänzende Partnerschaften mit SambaNova, Vista Equity und Cambium für kosteneffiziente Inferenz an. Hybrid Compute wurde als architektonisches Fundament für das kommende Zeitalter der „Agentic AI“ bezeichnet .
Die Botschaft ist klar: Das Rechenzentrum verschwindet nicht, aber es ist nicht länger der einzige Ort, an dem Intelligenz stattfindet. Im hybriden Modell, auf das Perplexity und Intel setzen, ist die Zukunft der KI ein ständiger Austausch zwischen dem eigenen Gerät und der Cloud – automatisch, intelligent und vor allem privat.
Comments
0 comments