すでに画面の内容を理解する「コンテキスト対応アシスタント」として機能していますが、現時点では自動でPC操作を行う仕組みではありません。
報道によるとSparkは、ユーザーのPC上で次のような操作を実行できる可能性があります。
想定されている構成は次の通りです。
リークでは、デスクトップ上に音声会話用のフローティングオーバーレイが表示され、次のような使い方が想定されています。
これは、デスクトップやアプリの状況をCursorコードエディタへストリーミングし、Geminiが開発中のコンテキストを理解したうえでコード提案を行う仕組みとされています。
詳細はまだ不明ですが、次のような機能が示唆されています。
これらの機能についてGoogleは正式発表していません。
考えられる公開方法は次の通りです。
また、これらの機能がGemini AdvancedやGoogle One AIプラン限定になるかどうかも現時点では明らかになっていません。
もしリーク通りの機能が実装されれば、Geminiは**「コンピューター操作AI」**という新しいカテゴリに本格参入することになります。
つまり、AIは次のようなことが可能になります。
一方で、デスクトップAIエージェントには新しいリスクもあります。
例えば次のようなアクセス権が必要になる可能性があります。
現時点では、Googleがどのような権限管理・監査ログ・安全対策を導入するのかは公表されていません。
現在、公式に確認できるのは次の点です。
一方で、以下の機能は主にリーク情報に基づくものです。
これらが実際にどの形で登場するのかは、Google I/O 2026での発表によって明らかになる可能性があります。
Comments
0 comments