L0:Raw Dialogue Layer(原始對話層)
完整保存所有對話與任務互動紀錄。
L1:Atomic Memory Layer(原子記憶層)
從對話中抽取事實,例如使用者偏好、限制條件或任務結論。
L2:Scenario Summary Layer(場景摘要層)
把與同一任務或情境相關的記憶整理成可重用的工作模式。
L3:User Profile Layer(使用者画像層)
提煉長期行為模式與偏好,形成簡化的使用者檔案。
在長任務場景中,真正造成 Token 爆炸的往往是工具輸出與日誌。騰訊的解法主要包含兩個機制。
當 Agent 呼叫工具(例如抓取網頁或執行程式)後:
另一個關鍵設計是 Mermaid Task Canvas。
在這張畫布中:
模型不需要閱讀完整歷史對話,而是透過這張「任務地圖」了解目前進度與下一步方向。
騰訊用一個簡單比喻說明差異:
Mermaid 任務畫布就扮演這張地圖的角色。
常見策略包括:
WideSearch
SWE‑bench
AA‑LCR
PersonaMem
TencentDB Agent Memory 在 2026 年其實經歷了兩個階段。
4 月版本
5 月 14 日開源版本
換句話說,早期版本重點在「記住過去」,而開源版本更強調「讓長任務不塞爆上下文」。
騰訊表示該系統已可整合到多個 Agent 架構中,例如:
這讓開發者能在現有 Agent 系統中加入記憶與壓縮能力,而不必重新設計整個架構。
隨著 AI Agent 從展示型 demo 走向實際應用,例如:
每一次工具呼叫產生的內容,都可能讓 prompt 成本增加並干擾推理。
騰訊的做法試圖同時解決兩件事:
如果這些效果在更多實際環境中得到驗證,像 TencentDB Agent Memory 這樣的記憶層,可能會成為未來 AI Agent 基礎架構的一部分。
目前來看,相關性能提升仍主要來自騰訊官方測試;未來是否能在不同模型與 Agent 框架中普遍成立,仍有待更多第三方實驗驗證。
Comments
0 comments