Về bản chất, Gemini Spark là một tác nhân phần mềm tự hành chạy trên một máy ảo chuyên dụng của Google Cloud. Đây chính là bước nhảy vọt cơ bản tách biệt nó khỏi một chatbot AI thông thường. Vì "bộ não" của Spark trú ngụ trên máy chủ của Google, nó có thể tiếp tục nghiên cứu, đặt vé, soạn thảo và giám sát các tác vụ ngay cả khi mọi thiết bị của bạn đã tắt nguồn. Khi hoàn thành, nó sẽ gửi cho bạn một thông báo kèm kết quả.
Google mô tả tác nhân này hoạt động "dưới sự chỉ đạo của bạn", tức là nó vận hành với các quyền được cấp trước để truy cập dữ liệu và thực hiện hành động, nhưng tồn tại như một tiến trình nền bền bỉ thay vì một công cụ bạn phải ra lệnh thủ công cho từng bước.
Sức mạnh của Spark đến từ Gemini 3.5 Flash, mô hình mới nhất của Google được tối ưu hóa cho tốc độ suy luận nhanh và khối lượng công việc tác nhân. Google cho biết Flash mang lại hiệu suất tác nhân tiên tiến với chi phí chưa bằng một nửa các mô hình tương đương hàng đầu khác.
Tác nhân này được xây dựng trên nền tảng Antigravity 2.0, một khuôn khổ phát triển nội bộ dùng để điều phối các hành vi đa bước của tác nhân. Nó kết nối với thế giới bên ngoài thông qua Giao thức Ngữ cảnh Mô hình (MCP), một tiêu chuẩn để liên kết các mô hình AI với các công cụ và nguồn dữ liệu bên ngoài.
Hành trình đến với công chúng của Spark diễn ra nhanh chóng một cách bất ngờ sau màn công bố tại I/O.
Hiện tại, sản phẩm mới chỉ khả dụng tại Mỹ, Google xác nhận có kế hoạch mở rộng ra quốc tế nhưng chưa đưa ra mốc thời gian cụ thể.
Spark không phải là một sản phẩm độc lập; nó được đóng gói độc quyền trong gói thuê bao Google AI Ultra. Trong một động thái định giá mạnh tay nhằm thúc đẩy việc áp dụng, Google đã giảm mạnh gói Ultra cơ bản từ 249,99 USD xuống chỉ còn 99,99 USD mỗi tháng tại I/O. Một gói cấp cao hơn ở mức 199,99 USD/tháng cũng tồn tại với các lợi ích bổ sung.
Ngoài Spark, gói 99,99 USD còn bao gồm giới hạn sử dụng ứng dụng Gemini cao gấp 5 lần so với gói AI Pro 20 USD, 20 TB dung lượng lưu trữ đám mây và gói YouTube Premium.
Khả năng của Spark là một bước nhảy vọt lớn so với các công cụ trước đây của Google vốn chỉ giới hạn trong trình duyệt như Project Mariner. Tác nhân này được thiết kế để xử lý các quy trình công việc phức tạp, kéo dài trên nhiều dịch vụ khác nhau.
Ngay từ đầu, Spark có thể đọc, tóm tắt, soạn thảo và giám sát email trong Gmail; quản lý và tạo sự kiện Calendar; tìm kiếm và sắp xếp tệp trên Drive; làm việc trong Docs, Sheets và Slides. Nó cũng tích hợp sâu với Chrome, Maps và YouTube.
Một nâng cấp quan trọng so với các tác nhân trước đây của Google là khả năng hoạt động bên trong các dịch vụ của bên thứ ba, không chỉ riêng các sản phẩm của Google. Sử dụng MCP, Spark có thể thay mặt người dùng tương tác với các trang đặt vé máy bay, nền tảng thương mại điện tử, dịch vụ đặt phòng khách sạn và các ứng dụng năng suất khác.
Spark có thể cùng lúc xử lý nhiều tác vụ. Mặc dù giới hạn đồng thời chính xác chưa được công khai, các báo cáo và bản demo cho thấy nó có thể quản lý nhiều quy trình song song — ví dụ, vừa tra cứu lựa chọn chuyến bay, vừa soạn email và theo dõi lịch để phát hiện xung đột.
Mọi tác nhân tự hành đều đặt ra câu hỏi về giới hạn hành động của nó khi không có con người giám sát. Cách tiếp cận của Google với Spark là dựa trên cấp quyền nhưng mang phạm vi rộng. Người dùng cấp cho tác nhân quyền truy cập liên tục vào các lĩnh vực cụ thể và Google tuyên bố trợ lý này hoạt động "dưới sự chỉ đạo của bạn".
Các tài liệu tiền phát hành ban đầu có một điều khoản gây tranh cãi về khả năng tự động mua hàng mà không cần xác nhận rõ ràng. Đến thời điểm ra mắt bản beta công khai, Google đã làm mềm ngôn ngữ này nhưng không loại bỏ hoàn toàn khái niệm đó. Phiên bản hiện tại yêu cầu sự cho phép của người dùng đối với các hành động nhạy cảm như mua sắm, chia sẻ dữ liệu và thay đổi tài khoản.
Các báo cáo cho thấy tính đến bản beta tháng 5 năm 2026, tính năng thanh toán vẫn chưa được kích hoạt và cổng phê duyệt của con người vẫn là biện pháp kiểm soát an toàn chính.
Gemini Spark không tự nhiên xuất hiện. Nó là đỉnh cao của hành trình 18 tháng bắt đầu từ một sự cố rò rỉ sản phẩm, phát triển qua một nguyên mẫu nghiên cứu được đặt tên công khai và cuối cùng là tác nhân tiêu dùng chủ lực của Google.
Gemini Spark không xuất hiện trong một thị trường trống vắng. Đến giữa năm 2026, ba phòng thí nghiệm AI hàng đầu đều đã đặt cược vào những kiến trúc riêng biệt cho một trợ lý AI cá nhân trông như thế nào.
Cách chơi của Google với Spark là neo tác nhân của mình trên đám mây và gắn kết nó chặt chẽ với hệ sinh thái dịch vụ rộng lớn của hãng. Google đặt cược rằng sự tích hợp sâu với Chrome và Workspace, xác thực Google không trở ngại, cùng mức giá phải chăng hơn sẽ khiến một tác nhân đám mây 24/7 hữu ích hơn một ứng dụng máy tính để bàn vẫn phụ thuộc vào tài nguyên máy cục bộ.
Thị trường trợ lý AI tự hành không còn là lý thuyết. Nó đã ở đây, được kiểm soát bằng phí thuê bao và đang thúc đẩy người dùng đặt ra một câu hỏi mới: không phải "tôi có thể yêu cầu AI làm gì?", mà là "tôi cảm thấy thoải mái để AI làm gì cho mình khi tôi vắng mặt?"
Comments
0 comments