Nhiều hệ thống tự động hóa AI hiện nay dựa vào trình duyệt chạy trên cloud. Người dùng phải đăng nhập tài khoản vào môi trường từ xa do dịch vụ AI kiểm soát.
Kimi WebBridge chọn hướng khác.
Tiện ích này chạy trực tiếp trong Chrome hoặc Edge của người dùng và kết nối với một dịch vụ bridge cục bộ trên máy tính. Các lệnh từ AI agent được gửi tới dịch vụ này, sau đó nó tương tác với trình duyệt thông qua Chrome DevTools Protocol để đọc nội dung trang, chụp màn hình, điều hướng và thực hiện hành động.
Vì mọi thứ chạy trên máy người dùng nên:
Tài liệu của Moonshot nhấn mạnh rằng trạng thái đăng nhập và nội dung trang luôn ở trên máy người dùng, giúp agent làm việc với các trang yêu cầu đăng nhập mà không phải xuất thông tin xác thực ra ngoài.
Điều này giảm đáng kể rào cản khi tự động hóa các dịch vụ cần tài khoản – một vấn đề phổ biến với nhiều công cụ AI agent.
Một điểm đáng chú ý khác là WebBridge được xây dựng như một lớp điều khiển trình duyệt dùng chung cho nhiều AI agent.
Hệ sinh thái WebBridge cho biết nó hỗ trợ nhiều môi trường agent và công cụ phát triển như:
Điều này nghĩa là WebBridge không phải chỉ là tính năng của một ứng dụng AI duy nhất, mà là một interface chung để nhiều agent có thể cắm vào và điều khiển trình duyệt.
Trong mô hình này:
Trong khi WebBridge xử lý phần tương tác trình duyệt, phần suy luận và lập kế hoạch được hỗ trợ bởi mô hình Kimi K2.6 của Moonshot AI.
Kimi K2.6 là mô hình agentic đa phương thức được xây dựng trên kiến trúc Mixture‑of‑Experts khoảng 1 nghìn tỷ tham số, với khoảng 32 tỷ tham số hoạt động cho mỗi token khi suy luận và cửa sổ ngữ cảnh khoảng 256K token.
Mô hình này được thiết kế cho các tác vụ dài và phức tạp, bao gồm:
Nền tảng của Moonshot cho biết Kimi K2.6 cải thiện khả năng tạo code dài hạn và thực thi agent tự động, giúp các workflow nhiều bước ổn định hơn.
Trong hệ thống WebBridge, vai trò thường được phân chia như sau:
Sự kết hợp này cho phép AI lập kế hoạch những quy trình phức tạp – ví dụ nghiên cứu sản phẩm trên nhiều trang rồi tổng hợp kết quả – trong khi WebBridge thực hiện các thao tác trình duyệt thực tế.
Việc ra mắt WebBridge phản ánh một xu hướng lớn trong AI: cuộc cạnh tranh không chỉ còn nằm ở mô hình AI, mà ở hạ tầng agent.
AI agent thường cần tương tác với các website thật, nhiều trong số đó yêu cầu đăng nhập. Khi dùng trình duyệt cloud, điều này có thể gây ra các vấn đề như:
Bằng cách cho phép agent hoạt động ngay trong trình duyệt của người dùng, WebBridge giảm đáng kể các rào cản này và giữ dữ liệu nhạy cảm ở thiết bị cục bộ.
Nếu mô hình này được áp dụng rộng rãi, nó có thể giúp AI agent thực tế hơn trong nhiều công việc như:
Chiến lược của Moonshot AI cho thấy một xu hướng rõ ràng trong ngành: các công ty đang xây dựng toàn bộ “stack” cho AI agent, không chỉ riêng mô hình.
Trong stack này:
Với WebBridge đóng vai trò lớp thực thi trên trình duyệt và Kimi K2.6 làm bộ não suy luận, Moonshot đang định vị hệ sinh thái của mình trong lớp hạ tầng kết nối AI với các workflow thực tế.
Khi AI chuyển từ việc trả lời câu hỏi sang tự hoàn thành nhiệm vụ, quyền kiểm soát lớp thực thi – đặc biệt là trình duyệt web – có thể trở thành một trong những phần quan trọng nhất của hệ sinh thái agent.
Comments
0 comments