換句話說,Gemini 已經可以理解你正在看的畫面,但它仍然主要是 提供建議的助手,而不是能真正操作電腦的系統工具。
其中一個最受關注的功能叫 Gemini Spark。
根據洩漏報導,Spark 可能是一個 桌面 AI 代理,可以直接在電腦上執行操作,例如:
如果落實,這將是 Google 助手策略的一大轉變。
概念大致如下:
另一個洩漏功能叫 Gemini Live。
這意味著 Gemini 可以:
對開發者而言,一個名為 Stream to Cursor 的功能也可能登場。
另一個被提及的模型是 Veo4 Omni。
早期消息指它可能是一個整合的影片創作系統,支援:
Google 尚未正式確認上述功能。
可能的推出方式包括:
目前也未確認是否需要 Gemini Advanced 或 Google One AI 訂閱才能使用。
如果這些功能真的推出,Gemini 將更接近新興的 「AI 電腦代理」類型。
這類系統不只是聊天,而是能:
不過,AI 代理也帶來新的風險。
如果 AI 可以讀取螢幕或整理檔案,它可能需要取得:
目前 Google 尚未公布這些功能的 權限控制、審計機制或安全保護措施。
目前可以確定的只有幾點:
而以下功能仍主要來自洩漏或早期版本發現:
這些功能會否按目前消息所說推出,或者以實驗形式登場,很可能要等 Google 在 I/O 的正式 발표才會揭曉。
Comments
0 comments