目前这些能力主要是让 Gemini 成为一个具备上下文理解能力的助手。它能分析屏幕内容,但基本不会主动操作系统。
报道称,Spark 被设计为一个能够在电脑上执行动作的 AI 代理,例如:
可能的逻辑是:
据称它会在桌面上提供一个浮动语音界面,让 Gemini 能够:
该功能据称可以:
目前信息有限,但泄露内容暗示它可能支持:
Google 尚未正式公布上述功能。
可能的发布方式包括:
此外,目前也不清楚这些功能是否需要 Gemini Advanced 或 Google One AI 订阅。
如果这些功能落地,Gemini 将进入一个新的竞争领域:AI 电脑代理(computer‑use agents)。
在这种模式下,AI 可以:
让 AI 直接操作电脑,也带来了新的隐私与安全挑战。
例如系统可能需要访问:
目前 Google 尚未公布这些潜在功能的 权限机制、安全策略或审计系统。
目前可以确认的事实包括:
而 Gemini Spark、Chat/Agent 模式、Gemini Live 屏幕感知语音、Stream to Cursor 以及 Veo4 Omni 等功能,目前主要来自泄露信息和早期版本分析。
这些功能是否会按现有描述推出,或以实验形式逐步上线,很可能要等到 Google I/O 2026 才会有更明确的答案。
Comments
0 comments