這些功能已讓 Gemini 具備「螢幕情境理解」能力,但它目前仍主要是一個 上下文感知的聊天助手,而不是能真正操作電腦的系統代理。
早期報導指出 Spark 可能具備:
如果這項能力正式推出,Gemini 可能不只回答問題,而是能真正 幫你管理電腦上的工作流程。一些報導甚至提到它可以「整理你的檔案」,顯示 Google 正朝 電腦操作型 AI 代理(computer‑use agents) 發展。
概念大致如下:
如果按照目前的描述,它可能支援:
Google 也可能加強 Gemini 與開發工具的整合。
目前可見的資訊不多,但傳聞能力包括:
Google 尚未正式確認上述功能。
可能的推出方式包括:
目前也不清楚這些功能是否需要 Gemini Advanced 或 Google One AI 訂閱。
若這些功能真的推出,Gemini 將更接近新興的 AI 電腦代理(AI computer‑use agents)。
這類 AI 的特點是能:
當 AI 開始操作電腦時,也會帶來新的風險。
例如:
目前可以確定的事實包括:
而以下功能仍主要來自爆料或程式碼分析:
這些能力是否會在 I/O 正式亮相,或以實驗功能形式推出,很快就會有答案。
Comments
0 comments