L0:Raw Dialogue(生データ層)
会話ログや操作履歴をそのまま保存。
L1:Atomic Memory(原子メモリ層)
会話から事実や結論、ユーザーの好みなどの構造化情報を抽出。
L2:Scenario Summary(シナリオ要約層)
特定のタスクやワークフローごとの経験をまとめる。
L3:User Profile(ユーザープロファイル層)
長期的な行動パターンや好みを圧縮したプロフィールを作る。
長時間タスクで最も問題になるのは、短期的に増え続けるコンテキストです。TencentDB Agent Memoryはこれを2つの仕組みで解決します。
モデルのコンテキストには、
・要約された情報
・参照リンク
・タスク状態
だけが残ります。
そのため、大量のログや文書がコンテキストを占有し続けることがなくなります。
MermaidはGitHubなどの技術ドキュメントで使われる図表記述言語で、テキストでフローチャートやグラフを表現できます。
この「タスクキャンバス」では
・ノード:タスクのステップ
・エッジ:依存関係
として整理され、各ノードに簡単な状態や要約が記録されます。
テンセントはこの違いを、次のように説明しています。
つまり、エージェントはすべての履歴を覚える必要はなく、タスクの構造だけ理解すればよいという発想です。
主な仕組みは次の通りです。
・L1圧縮(リアルタイム要約):ツール実行後に結果を要約
・L2圧縮(タスクキャンバス更新):ワークフロー構造をMermaidで整理
・L3圧縮(深い圧縮):コンテキスト使用率が約80%以上で古い情報を強く圧縮
主な結果は以下の通りです。
TencentDB Agent Memoryは2026年に段階的に公開されました。
つまり、最初の発表が「長期記憶」、その後の公開が「長時間タスクのコンテキスト管理」を主題としていました。
テンセントによると、Agent Memoryはすでに複数のエージェントフレームワークと統合可能です。
例:
これにより、既存のエージェントシステムを大きく作り替えなくても、メモリ機能を追加できます。
AIエージェントが実用化に近づくにつれ、重要になるのはモデルの知能だけではなく運用コストです。
TencentDB Agent Memoryは、
・トークン消費を減らしてコストを下げる
・構造化されたタスク記憶でエージェントの迷走を減らす
という2つの問題を同時に解決しようとしています。
もし今後、さまざまなモデルやフレームワークで同様の効果が確認されれば、こうしたメモリ管理レイヤーは自律型AIエージェントの重要な基盤になる可能性があります。
ただし現時点では、性能向上の多くはテンセント自身のテスト結果であり、今後の独立ベンチマークによる検証が注目されています。
Comments
0 comments