TencentDB Agent Memory: Cara Sistem Memori Berlapis Tencent Membuat Agen AI Lebih Murah dan Stabil
Tencent Cloud merilis open‑source TencentDB Agent Memory yang menggabungkan memori jangka panjang dan kompresi konteks untuk agen AI dalam tugas panjang. Teknik “Context Offloading + Mermaid Task Canvas” memindahkan data besar ke penyimpanan eksternal sambil mempertahankan peta tugas ringkas di konteks model.
What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + MermaiTencentDB Agent Memory uses layered memory and a structured task graph to compress agent context and reduce token consumption.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + Mermai. Article summary: TencentDB Agent Memory is Tencent Cloud’s open-source memory layer for AI agents: it combines long-term personalized memory with short-term context compression so agents can run longer tasks without stuffing every tool r. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "3 weeks ago - Tencent Cloud’s Cube Sandbox goes fully open source with five technical breakthroughs, providing a production-grade foundation for AI Agent deployment at industrial s" source context "Tencent Cloud Cube Sandbox Goes Fully Open-Source, with Five Major Breakthroughs Enabling Large-Scale Agent Deployment -" Reference
openai.com
Agen AI modern—yang melakukan riset web, menulis kode, atau menganalisis dokumen—sering menghadapi keterbatasan mendasar: ukuran context window. Semakin lama sebuah agen menjalankan tugas, semakin banyak log, hasil pencarian, dan langkah perantara yang harus dimasukkan kembali ke prompt model. Akibatnya, biaya token meningkat dan model menjadi lebih sulit menjaga fokus.
Untuk mengatasi masalah ini, Tencent Cloud merilis TencentDB Agent Memory, sebuah mesin memori untuk agen AI yang di‑open‑source pada Mei 2026. Sistem ini memperkenalkan arsitektur memori berlapis serta teknik “Context Offloading + Mermaid Task Canvas” yang memungkinkan agen menyimpan informasi besar di luar konteks model sambil mempertahankan representasi ringkas di dalamnya. Dalam pengujian internal Tencent, pendekatan ini mampu mengurangi konsumsi token hingga 61% sekaligus meningkatkan tingkat keberhasilan tugas panjang.
Apa Itu TencentDB Agent Memory
TencentDB Agent Memory adalah mesin memori open‑source yang dirancang untuk agen AI yang menjalankan workflow panjang dan bertahap. Proyek ini dirilis dengan lisensi MIT, sehingga dapat digunakan dan dimodifikasi oleh pengembang secara bebas.
Tujuan utamanya adalah memberi agen kemampuan untuk:
Mengingat preferensi pengguna dan pola kerja sebelumnya
Menyimpan status tugas selama rangkaian langkah yang panjang
Mengurangi jumlah data mentah yang harus dimasukkan ke prompt model
Alih‑alih memasukkan setiap hasil pencarian, log, atau pesan perantara ke dalam konteks model, sistem ini menyusun informasi tersebut menjadi lapisan memori terstruktur dan ringkasan.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Apa jawaban singkat untuk "TencentDB Agent Memory: Cara Sistem Memori Berlapis Tencent Membuat Agen AI Lebih Murah dan Stabil"?
Tencent Cloud merilis open‑source TencentDB Agent Memory yang menggabungkan memori jangka panjang dan kompresi konteks untuk agen AI dalam tugas panjang.
Apa poin penting yang harus divalidasi terlebih dahulu?
Tencent Cloud merilis open‑source TencentDB Agent Memory yang menggabungkan memori jangka panjang dan kompresi konteks untuk agen AI dalam tugas panjang. Teknik “Context Offloading + Mermaid Task Canvas” memindahkan data besar ke penyimpanan eksternal sambil mempertahankan peta tugas ringkas di konteks model.
Apa yang harus saya lakukan selanjutnya dalam latihan?
Dalam pengujian internal, Tencent melaporkan penghematan token hingga 61% dan peningkatan tingkat keberhasilan pada beberapa benchmark agen AI.
Desain Tencent membagi memori jangka panjang menjadi empat lapisan yang secara bertahap mengubah interaksi mentah menjadi pengetahuan yang lebih terstruktur.
L0: Raw Dialogue Layer
Menyimpan seluruh percakapan dan interaksi tugas persis seperti aslinya.
L1: Atomic Memory Layer
Menarik fakta terstruktur dari interaksi tersebut, misalnya preferensi pengguna, batasan tugas, atau kesimpulan dari langkah sebelumnya.
L2: Scenario Summary Layer
Menggabungkan memori yang berkaitan dengan skenario atau jenis tugas tertentu, sehingga agen dapat mengenali pola dari workflow yang serupa.
L3: User Profile Layer
Merangkum pola perilaku dan preferensi jangka panjang pengguna dalam bentuk profil yang ringkas.
Dengan pendekatan ini, percakapan mentah secara bertahap diubah menjadi pengetahuan yang dapat digunakan kembali. Seiring waktu, agen dapat memanfaatkan pengalaman sebelumnya tanpa harus menghitung ulang semuanya dari awal.
Efisiensi terbesar sistem ini muncul dari cara Tencent menangani memori kerja jangka pendek saat agen menjalankan tugas panjang.
Context Offloading
Setelah agen melakukan pemanggilan alat—misalnya mengambil halaman web atau menjalankan kode—hasil lengkapnya dipindahkan ke penyimpanan eksternal. Di dalam konteks model hanya tersisa ringkasan padat atau referensi singkat.
Pendekatan ini mencegah output besar seperti halaman web, log kode, atau dokumen panjang terus memenuhi prompt model.
Mermaid Task Canvas
Sebagai pengganti riwayat teks panjang, Tencent menggunakan graf tugas terstruktur berbasis Mermaid, bahasa diagram berbasis teks yang populer dalam dokumentasi pengembang.
Canvas ini berfungsi seperti peta navigasi bagi agen:
node mewakili langkah tugas
edge menunjukkan hubungan atau dependensi
setiap node berisi ringkasan status atau hasil langkah
Karena model hanya perlu memahami struktur tugas, bukan seluruh riwayat pesan, agen dapat mengelola workflow kompleks dengan jauh lebih sedikit token.
Tencent menggambarkannya dengan analogi sederhana: log mencatat semua hal, tetapi peta membantu navigasi. Mermaid task canvas bertindak sebagai peta tersebut.
Kompresi Konteks Berdasarkan “Water Level”
TencentDB Agent Memory juga menerapkan kompresi konteks secara adaptif berdasarkan seberapa penuh context window model. Sistem memantau tingkat penggunaan ini—disebut sebagai "water level"—dan menerapkan tingkat kompresi yang berbeda.
Beberapa ambang umum meliputi:
Ringkasan real‑time (L1): hasil tool diringkas segera setelah eksekusi.
Pembaruan task canvas (L2): peta tugas Mermaid diperbarui secara asinkron untuk mencatat struktur workflow.
Deep compression (L3): ketika penggunaan konteks mencapai sekitar 80%, pesan lama dikompresi secara agresif atau dihapus.
Jika penggunaan mendekati batas kritis (sekitar 95%), sistem memicu kompresi darurat untuk menurunkan beban konteks kembali.
Hasil Benchmark yang Dilaporkan
Tencent melaporkan beberapa peningkatan performa saat Agent Memory diintegrasikan ke framework agen. Namun angka ini berasal dari pengujian internal vendor, bukan benchmark independen.
Beberapa hasil yang dilaporkan antara lain:
WideSearch benchmark
Pass rate: 33% → 50% (peningkatan relatif 51.52%)
Penggunaan token: 221.31M → 85.64M (turun 61.38%)
SWE‑bench
Success rate: 58.4% → 64.2%
Token: 3474.1M → 2375.4M (turun 33.09%)
AA‑LCR benchmark
Success rate: 44.0% → 47.5%
Token: 112.0M → 77.3M (turun 30.98%)
PersonaMem benchmark
Akurasi meningkat dari sekitar 48% menjadi 76% setelah sistem memori ditambahkan.
Tencent juga melaporkan pengujian pada 1.540 tugas yang mencakup pembuatan kode, pencarian web, analisis dokumen, dan workflow multi‑langkah panjang. Hasilnya menunjukkan peningkatan penyelesaian tugas 12–35% dengan penurunan konsumsi token 33–64%.
Perubahan dari Peluncuran April ke Rilis 14 Mei
TencentDB Agent Memory sebenarnya sudah diperkenalkan lebih awal pada 2026, tetapi fokusnya berubah antara dua tahap peluncuran.
Peluncuran April
Memperkenalkan sistem memori jangka panjang dengan arsitektur empat lapis
Menunjukkan peningkatan performa pada benchmark PersonaMem
Fokus pada memori yang bertahan lintas sesi pengguna
Rilis open‑source 14 Mei
Merilis seluruh stack sebagai open‑source dengan lisensi MIT
Menambahkan sistem kompresi memori jangka pendek untuk tugas panjang
Singkatnya, versi awal menekankan memori permanen, sementara rilis open‑source menargetkan masalah context window yang penuh saat agen bekerja dalam satu tugas panjang.
Integrasi dengan Framework Agen
Tencent menyebutkan sistem ini sudah dapat digunakan bersama beberapa framework agen.
Contohnya:
OpenClaw, sebagai plugin peningkatan memori
Hermes Gateway / Hermes Agent, dengan dukungan deployment Docker untuk Hermes Gateway versi 0.3.4 atau lebih baru
Integrasi ini memungkinkan pengembang menambahkan kemampuan memori dan kompresi konteks tanpa harus merombak seluruh arsitektur agen.
Mengapa Ini Penting dalam Perlombaan Agen AI
Saat agen AI bergerak dari demo menuju aplikasi nyata—seperti asisten coding, agen riset, atau otomatisasi workflow perusahaan—biaya dan keterbatasan context window menjadi hambatan besar. Rantai panggilan alat yang panjang dapat dengan cepat meningkatkan penggunaan token dan menurunkan kualitas penalaran model.
Pendekatan Tencent mencoba menyelesaikan dua masalah sekaligus:
Biaya: pengurangan token berarti biaya operasional yang lebih rendah.
Keandalan: peta tugas terstruktur membantu agen menjaga arah dalam workflow kompleks.
Jika hasil yang dilaporkan ini terbukti konsisten dalam pengujian independen, sistem seperti TencentDB Agent Memory bisa menjadi lapisan infrastruktur penting untuk agen AI otonom di masa depan.
Untuk saat ini, angka performa tersebut masih berasal dari laporan internal Tencent, sehingga validasi independen yang lebih luas akan menentukan seberapa baik pendekatan ini bekerja di berbagai model dan framework agen.
Comments
0 comments