Zu den wichtigsten Funktionen gehören derzeit:
Schon jetzt kann der Assistent sehen, was auf dem Bildschirm passiert. Allerdings agiert er derzeit hauptsächlich als Kontext‑Assistent, nicht als Automatisierungstool.
Eine der meistdiskutierten möglichen Neuerungen heißt Gemini Spark. Leak‑Berichten zufolge handelt es sich um einen KI‑Agenten, der direkt auf dem Computer arbeiten kann.
Demnach könnte Spark unter anderem:
Berichte sprechen davon, dass Gemini künftig beispielsweise Dateien selbstständig sortieren oder verwalten könnte. Damit würde der Assistent näher an sogenannte Computer‑Use‑Agents rücken – KI‑Systeme, die aktiv Aufgaben erledigen statt nur Antworten zu liefern.
Ein weiteres Gerücht betrifft die Benutzeroberfläche. Sie könnte künftig zwei unterschiedliche Modi bieten.
Diese Aufteilung würde ein wachsendes Muster in KI‑Software widerspiegeln: Nutzer unterscheiden klar zwischen „Fragen stellen“ und „Arbeit delegieren“.
Eine weitere gemeldete Funktion heißt Gemini Live. Dabei handelt es sich offenbar um ein schwebendes Sprach‑Overlay auf dem Desktop.
Damit könnte Gemini:
Der Unterschied zu bisherigen Funktionen: Statt nur einen Screenshot zu analysieren, würde Gemini laufend auf das reagieren, was gerade auf dem Bildschirm sichtbar ist.
Auch Entwickler könnten neue Werkzeuge bekommen. Ein gemeldetes Feature namens Stream to Cursor soll Desktop‑Kontext direkt an den Code‑Editor Cursor übertragen.
Dadurch könnte Gemini Vorschläge generieren, die auf dem aktuellen Arbeitskontext basieren – etwa auf geöffneten Dateien oder dem aktuellen Projekt.
Das passt zu Googles Ankündigung, bei der I/O 2026 besonders „agentic coding“ hervorzuheben – also KI‑Systeme, die aktiv beim Programmieren helfen.
Die wenigen bekannten Hinweise deuten auf:
Da diese Informationen aus Build‑Analysen stammen und nicht aus offiziellen Ankündigungen, sind Details und Funktionsumfang noch unsicher.
Google hat diese Features bislang nicht offiziell bestätigt.
Die wahrscheinlichste Bühne für Ankündigungen oder erste Demos ist jedoch die Google I/O 2026. Dort will das Unternehmen neue Gemini‑Modelle und KI‑Funktionen vorstellen.
Mögliche Szenarien:
Unklar ist auch, ob einige Funktionen nur mit Gemini Advanced oder Google‑One‑AI‑Abos verfügbar sein könnten.
Sollten diese Funktionen tatsächlich erscheinen, würde Gemini in eine neue Kategorie von Software aufsteigen: KI‑Agenten, die Computer aktiv bedienen können.
Ein solcher Assistent könnte beispielsweise:
Berichte sehen darin auch eine Reaktion auf konkurrierende Agent‑Experimente anderer KI‑Anbieter, die ebenfalls versuchen, Softwareumgebungen direkt von KI steuern zu lassen.
Mit solchen Fähigkeiten entstehen allerdings auch neue Risiken.
Ein Desktop‑Agent, der Dateien organisiert oder den Bildschirm liest, benötigt möglicherweise Zugriff auf:
Dadurch könnten sensible Daten verarbeitet werden, und automatisierte Aktionen könnten Fehler verursachen, wenn Anweisungen falsch interpretiert werden.
Bislang hat Google keine Details zu Berechtigungen, Sicherheitsmechanismen oder Audit‑Protokollen dieser möglichen Funktionen veröffentlicht.
Einige Punkte sind bereits bestätigt:
Andere viel diskutierte Features – darunter Gemini Spark, Chat/Agent‑Modus, Gemini Live, Stream to Cursor und Veo4 Omni – stammen derzeit überwiegend aus Leak‑Berichten und frühen Build‑Analysen.
Ob diese Funktionen tatsächlich so erscheinen oder zunächst nur experimentell bleiben, dürfte sich spätestens zeigen, wenn Google seine nächste Generation von Gemini‑Updates auf der I/O präsentiert.
Comments
0 comments