En lugar de limitarse a dar instrucciones al usuario, la IA puede ejecutar las acciones por sí misma dentro del navegador.
Muchas plataformas de automatización con IA utilizan navegadores alojados en la nube. En ese modelo, el usuario inicia sesión en sus cuentas dentro de un entorno remoto controlado por el servicio de IA.
Kimi WebBridge adopta un enfoque distinto.
La extensión se ejecuta directamente en el navegador del usuario y se conecta a un servicio puente local instalado en el equipo. Los comandos del agente se envían a ese servicio local, que interactúa con el navegador mediante el Chrome DevTools Protocol para leer páginas, navegar, capturar pantallas y ejecutar acciones.
Como todo se ejecuta localmente:
La documentación de Moonshot destaca que los estados de inicio de sesión y el contenido web permanecen en la máquina del usuario, lo que permite que los agentes trabajen con sitios autenticados sin exportar credenciales a la nube.
Esto reduce una de las mayores fricciones de la automatización basada en agentes: acceder de forma segura a servicios que requieren autenticación.
Otro aspecto interesante es que WebBridge está diseñado para ser agnóstico respecto al agente.
En lugar de pertenecer a una sola aplicación de IA, actúa como una interfaz de navegador que diferentes agentes pueden usar. Entre los entornos compatibles se mencionan:
Esto convierte a WebBridge en una especie de capa compartida de control del navegador donde distintos agentes pueden conectarse.
En este esquema, el agente se encarga del razonamiento y la planificación, mientras WebBridge ejecuta las acciones en el navegador real.
Mientras WebBridge controla el navegador, el razonamiento detrás de tareas complejas proviene del modelo Kimi K2.6 de Moonshot AI.
Kimi K2.6 es un modelo orientado a agentes construido con una arquitectura Mixture‑of‑Experts de aproximadamente 1 billón de parámetros (con unos 32 mil millones activos por token durante la inferencia) y un contexto cercano a 256K tokens.
Está diseñado para tareas de larga duración y flujos de trabajo autónomos, incluyendo:
La plataforma de Moonshot señala que el modelo mejora la ejecución autónoma y la estabilidad en tareas complejas de programación y automatización, lo que facilita que los agentes mantengan procesos largos y coordinados.
En un sistema con WebBridge, normalmente se reparten así las funciones:
Así, un agente puede planificar una tarea compleja —por ejemplo investigar productos en varios sitios y recopilar resultados— mientras WebBridge ejecuta cada interacción en el navegador.
El lanzamiento refleja un cambio importante en el desarrollo de herramientas de IA: la competencia ya no se centra solo en los modelos, sino también en la infraestructura para agentes.
Los agentes suelen necesitar interactuar con sitios web reales, muchos de ellos con autenticación. Los navegadores en la nube introducen problemas como:
Al permitir que los agentes trabajen directamente en el navegador del usuario, WebBridge reduce gran parte de esa fricción y mantiene los datos sensibles en el dispositivo.
Si este enfoque se adopta ampliamente, podría facilitar flujos de trabajo con agentes para tareas como:
La estrategia de Moonshot apunta a una tendencia más amplia en la industria de la IA: construir pilas completas para agentes, no solo modelos.
En ese tipo de arquitectura:
Con WebBridge como capa de ejecución en el navegador y Kimi K2.6 como motor de razonamiento, Moonshot busca posicionarse en esa infraestructura emergente que conecta agentes de IA con flujos de trabajo del mundo real.
A medida que los sistemas de IA evolucionan de responder preguntas a realizar tareas completas, controlar la capa de ejecución —especialmente el navegador— podría convertirse en uno de los componentes más estratégicos del ecosistema de agentes.
Comments
0 comments