AIエージェントからの命令はローカルサービスに送られ、そこから Chrome DevTools Protocol を通じてブラウザを操作します。ページ読み取り、ナビゲーション、スクリーンショット取得などもこの仕組みで行われます。
すべての処理がローカルで行われるため、次の利点があります。
この設計により、認証が必要なサイトの自動化で発生していた設定の複雑さやセキュリティ上の懸念が大きく減ります。
WebBridgeのもう一つの特徴は、特定のAIアプリに縛られない エージェント非依存(agent‑agnostic)設計 です。
公式ページでは、次のような開発ツールやエージェント環境での利用が挙げられています。
実際の役割分担は次のようになります。
ブラウザ操作そのものはWebBridgeが担当しますが、複雑なタスクの計画や推論を担うのが Kimi K2.6 モデルです。
Kimi K2.6はMoonshot AIが公開したエージェント向けモデルで、
このモデルは特に次の用途を想定しています。
WebBridgeと組み合わせると、役割は次のようになります。
例えばAIが複数のECサイトを調査し、価格を比較し、結果をまとめるといった一連の流れも、この組み合わせで実行できます。
AIの進化は、単なるモデル性能競争から エージェント基盤(agent infrastructure)競争 に移りつつあります。
AIエージェントが現実の作業を行うためには、実際のソフトウェアやWebサービスに接続する仕組みが必要です。
しかしクラウドブラウザ型の自動化にはいくつかの問題があります。
その結果、AIエージェントは次のような作業により実用的に使える可能性があります。
Moonshot AIの動きは、AI企業が モデルだけでなくエージェント用インフラ全体を構築し始めている ことを示しています。
現在のAIエージェントの構成は大きく次の3層で考えられます。
この中でWebBridgeは「ブラウザ実行レイヤー」を担い、Kimi K2.6は推論エンジンとして動作します。
AIが質問回答から 実際のタスク実行 へと進むにつれ、ブラウザを含む実行レイヤーの重要性はさらに高まると見られています。
Comments
0 comments