Bên cạnh khả năng suy luận, Google cũng đang chuẩn bị mở rộng kết nối với các dịch vụ bên ngoài. Tài liệu hỗ trợ và các tham chiếu trong ứng dụng cho thấy những tích hợp sắp tới gồm:
Các tích hợp này vẫn chưa được triển khai rộng rãi, nhưng Gemini đã hỗ trợ một số dịch vụ khác như GitHub, OpenStax, Spotify và WhatsApp.
Nếu hoạt động tương tự các tích hợp hiện có, người dùng có thể thực hiện nhiều việc trực tiếp trong cuộc trò chuyện với Gemini, chẳng hạn:
Điều này giúp giảm việc phải chuyển qua lại giữa nhiều ứng dụng khác nhau.
Trong Gemini, các dịch vụ được kết nối thường hoạt động thông qua tên gọi hoặc “handle” ứng dụng, ví dụ như @GitHub hoặc @Spotify. Người dùng có thể nhắc đến chúng trong câu lệnh để Gemini truy cập dữ liệu hoặc thực hiện tác vụ.
Ở phía kỹ thuật, Gemini sẽ kích hoạt các chức năng (functions) trong ứng dụng liên kết và trả kết quả trực tiếp trong cuộc trò chuyện. Nhờ vậy, người dùng có thể xem kết quả hoặc hoàn thành công việc mà không cần rời khỏi giao diện trợ lý.
Tuy nhiên, các chi tiết như quyền truy cập, lệnh cụ thể hoặc cách kích hoạt các tích hợp mới vẫn chưa được công bố đầy đủ.
Hai thay đổi — điều chỉnh mức suy luận và mở rộng tích hợp ứng dụng — cho thấy hướng đi rõ ràng của Google đối với Gemini.
Thay vì chỉ là chatbot trả lời câu hỏi, Gemini đang được phát triển thành trợ lý AI có khả năng thực hiện hành động. Điều đó có nghĩa là hệ thống có thể:
Đây cũng là xu hướng chung của ngành AI: các trợ lý đang chuyển từ “trả lời thông tin” sang “thực hiện tác vụ” thay cho người dùng.
Do thông tin hiện chủ yếu đến từ các bản cập nhật ứng dụng và tài liệu hỗ trợ, một số chi tiết vẫn chưa được xác nhận:
Nhiều khả năng Google sẽ công bố thêm thông tin trong các sự kiện lớn như Google I/O.
Dù vậy, xu hướng đã khá rõ: Google đang biến Gemini thành một trung tâm điều khiển kỹ thuật số, nơi người dùng không chỉ hỏi AI mà còn có thể hoàn thành công việc ngay trong cuộc trò chuyện.
Comments
0 comments