TencentDB Agent Memory: สถาปัตยกรรมหน่วยความจำหลายชั้นที่ช่วยให้ AI Agents ทำงานยาว ๆ ได้ถูกลงและเสถียรกว่าเดิม | ตอบ | Studio Global
What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + Mermai TencentDB Agent Memory uses layered memory and a structured task graph to compress agent context and reduce token consumption. AI พรอมต์ Create a landscape editorial hero image for this Studio Global article: What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + Mermai. Article summary: TencentDB Agent Memory is Tencent Cloud’s open-source memory layer for AI agents: it combines long-term personalized memory with short-term context compression so agents can run longer tasks without stuffing every tool r. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "3 weeks ago - Tencent Cloud’s Cube Sandbox goes fully open source with five technical breakthroughs, providing a production-grade foundation for AI Agent deployment at industrial s" source context "Tencent Cloud Cube Sandbox Goes Fully Open-Source, with Five Major Breakthroughs Enabling Large-Scale Agent Deployment -" Reference
openai.com ปัญหาหลักของ AI Agents: context window ที่เต็มเร็วเกินไป
AI agents ที่ต้องทำงานหลายขั้นตอน เช่น ค้นเว็บ เขียนโค้ด หรือวิเคราะห์เอกสาร มักเจอข้อจำกัดสำคัญคือ context window ของโมเดล เมื่อภารกิจยาวขึ้น ข้อมูลอย่างผลลัพธ์จากเครื่องมือ (tool outputs) บันทึกการทำงาน และขั้นตอนการให้เหตุผลจะสะสมใน prompt อย่างรวดเร็ว ส่งผลให้ค่าใช้โทเคนสูงขึ้น และบางครั้งโมเดลก็เริ่ม “หลุดโฟกัส” จากงานหลัก
Tencent Cloud จึงเปิดซอร์สระบบ TencentDB Agent Memory ในเดือนพฤษภาคม 2026 เพื่อแก้ปัญหานี้ โดยออกแบบให้เอเจนต์สามารถเก็บข้อมูลรายละเอียดจำนวนมากไว้ภายนอก context แต่ยังคงรักษาโครงสร้างข้อมูลสำคัญใน prompt ไว้ได้อย่างมีประสิทธิภาพ
จากการทดสอบภายในของ Tencent วิธีนี้ช่วยลดการใช้โทเคนได้สูงสุดประมาณ 61% พร้อมเพิ่มอัตราความสำเร็จของงานที่มีหลายขั้นตอน
TencentDB Agent Memory คืออะไร
TencentDB Agent Memory เป็น memory engine แบบโอเพ่นซอร์ส สำหรับ AI agents ที่ต้องทำงานแบบ workflow ยาว ๆ หลายขั้นตอน โครงการนี้เผยแพร่ภายใต้ไลเซนส์ MIT และรองรับทั้ง
หน่วยความจำระยะยาว (long‑term memory) ข้าม session
การบีบอัดบริบทระหว่างงาน (short‑term context compression)
แนวคิดหลักคือให้เอเจนต์สามารถ
จดจำความชอบของผู้ใช้และรูปแบบการทำงาน
เก็บสถานะของงานที่มีหลายขั้นตอน
ลดการใส่ข้อมูลดิบจำนวนมากเข้าไปใน prompt ของโมเดล
แทนที่จะใส่ผลลัพธ์ทุกอย่าง เช่น เนื้อหาเว็บหรือ log ลงใน context ระบบจะจัดระเบียบข้อมูลเป็นโครงสร้างและสรุปให้สั้นลง
คนยังถาม คำตอบสั้น ๆ สำหรับ "TencentDB Agent Memory: สถาปัตยกรรมหน่วยความจำหลายชั้นที่ช่วยให้ AI Agents ทำงานยาว ๆ ได้ถูกลงและเสถียรกว่าเดิม" คืออะไร Tencent Cloud เปิดซอร์ส TencentDB Agent Memory ระบบหน่วยความจำสำหรับ AI Agents ที่รวมหน่วยความจำระยะยาวแบบหลายชั้นและการบีบอัดบริบทระยะสั้น เพื่อลดปัญหา context window ล้น
ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร? Tencent Cloud เปิดซอร์ส TencentDB Agent Memory ระบบหน่วยความจำสำหรับ AI Agents ที่รวมหน่วยความจำระยะยาวแบบหลายชั้นและการบีบอัดบริบทระยะสั้น เพื่อลดปัญหา context window ล้น เทคนิค Context Offloading และ Mermaid Task Canvas ช่วยเก็บข้อมูลดิบไว้นอก prompt แต่คงไว้เพียงแผนผังงานแบบย่อ ทำให้เอเจนต์ทำงานหลายขั้นตอนได้โดยใช้โทเคนน้อยลง
ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ? Tencent รายงานว่าระบบช่วยลดการใช้โทเคนได้สูงสุด 61% และเพิ่มอัตราความสำเร็จของงานในหลาย benchmark แม้ว่าผลลัพธ์เหล่านี้ยังเป็นการทดสอบที่รายงานโดยผู้พัฒนาเอง
สถาปัตยกรรมหน่วยความจำระยะยาว 4 ชั้น Tencent ออกแบบหน่วยความจำระยะยาวเป็น 4 ชั้น ที่ค่อย ๆ เปลี่ยนบทสนทนาและข้อมูลดิบให้กลายเป็นความรู้เชิงโครงสร้าง
L0: Raw Dialogue Layer
เก็บบทสนทนาและการโต้ตอบทั้งหมดในรูปแบบเดิมแบบครบถ้วน
L1: Atomic Memory Layer
สกัดข้อเท็จจริงสำคัญ เช่น ความชอบของผู้ใช้ ข้อจำกัด หรือข้อสรุปจากขั้นตอนก่อนหน้า
L2: Scenario Summary Layer
รวมหน่วยความจำที่เกี่ยวข้องกับสถานการณ์หรือประเภทงานเดียวกัน เพื่อให้เอเจนต์มองเห็นรูปแบบของงานซ้ำ ๆ
L3: User Profile Layer
สรุปพฤติกรรมและความชอบระยะยาวของผู้ใช้ให้เป็นโปรไฟล์ขนาดเล็ก
ผลลัพธ์คือข้อมูลจะค่อย ๆ เปลี่ยนจากบทสนทนาดิบไปเป็น knowledge structure ที่นำกลับมาใช้ซ้ำได้ ทำให้เอเจนต์ไม่ต้องคำนวณใหม่ทุกครั้ง
นวัตกรรมสำคัญ: Context Offloading + Mermaid Task Canvas จุดเด่นหลักของระบบอยู่ที่การจัดการ หน่วยความจำระยะสั้น ระหว่างที่เอเจนต์กำลังทำงาน
Context Offloading หลังจากเอเจนต์เรียกใช้เครื่องมือ เช่น
ดาวน์โหลดหน้าเว็บ
รันโค้ด
วิเคราะห์เอกสาร
ผลลัพธ์ทั้งหมดจะถูก ย้ายออกจาก prompt ไปเก็บใน storage ภายนอก และใน context จะเหลือเพียง
สรุปสั้น ๆ
หรือตัวอ้างอิง
วิธีนี้ช่วยป้องกันไม่ให้ผลลัพธ์ขนาดใหญ่กินพื้นที่ context ของโมเดล
Mermaid Task Canvas แทนที่จะเก็บประวัติข้อความยาว ๆ Tencent ใช้ แผนผังงาน (task graph) ที่เขียนด้วยภาษา Mermaid
Mermaid เป็นภาษาสำหรับสร้างไดอะแกรมด้วยข้อความ ซึ่งถูกใช้แพร่หลายในเอกสารนักพัฒนาและ GitHub และโมเดลภาษาใหญ่ส่วนใหญ่สามารถอ่านและเขียนได้โดยตรง
node = ขั้นตอนของงาน
edge = ความสัมพันธ์หรือ dependency
แต่ละ node มีสถานะหรือสรุปสั้น ๆ
ผลลัพธ์คือโมเดลต้องคิดจาก โครงสร้างของงาน แทนการอ่านข้อความทุกบรรทัด ทำให้ใช้โทเคนน้อยลงมาก
Tencent อธิบายแนวคิดนี้ง่าย ๆ ว่า
“บันทึกเหตุการณ์เหมือนสมุดบันทึก แต่การนำทางต้องใช้แผนที่” — และ Mermaid Task Canvas ก็ทำหน้าที่เป็นแผนที่ของงาน
การบีบอัดบริบทแบบปรับระดับอัตโนมัติ ระบบยังมีการบีบอัด context แบบไดนามิกตามระดับการใช้งานของ context window หรือที่ Tencent เรียกว่า context water level
ระดับการจัดการโดยทั่วไป ได้แก่
L1 สรุปแบบเรียลไทม์: หลังการเรียกใช้เครื่องมือ ระบบจะสร้างสรุปสั้น ๆ ทันที
L2 อัปเดต task canvas: แผนผัง Mermaid ถูกอัปเดตแบบ asynchronous เพื่อสะท้อนโครงสร้างของ workflow
L3 การบีบอัดลึก: หากการใช้ context ใกล้ 80% ข้อความเก่าที่ไม่จำเป็นจะถูกย่อหรือทิ้ง
หากการใช้งานพุ่งถึงประมาณ 95% ระบบจะใช้การบีบอัดฉุกเฉินเพื่อลด context ลงอีกครั้ง
ผลการทดสอบที่ Tencent รายงาน Tencent รายงานผลจากการทดลองภายในหลาย benchmark ซึ่งควรตีความว่าเป็น ผลลัพธ์ที่ผู้พัฒนาเป็นผู้รายงานเอง ยังไม่ได้มีการทดสอบซ้ำอย่างกว้างขวางจากภายนอก
อัตราผ่าน: 33% → 50%
การใช้โทเคน: 221.31M → 85.64M (ลดลง 61.38%)
อัตราสำเร็จ: 58.4% → 64.2%
การใช้โทเคนลดลง 33.09%
อัตราสำเร็จ: 44.0% → 47.5%
การใช้โทเคนลดลง 30.98%
ความแม่นยำเพิ่มจากประมาณ 48% เป็นประมาณ 76% หลังเพิ่มระบบหน่วยความจำ
นอกจากนี้ Tencent ยังทดสอบกับ 1,540 งาน ครอบคลุมการสร้างโค้ด การค้นเว็บ และการวิเคราะห์เอกสาร โดยรายงานว่า
อัตราสำเร็จของงานเพิ่มขึ้นประมาณ 12–35%
การใช้โทเคนลดลงประมาณ 33–64%
ความแตกต่างระหว่างการเปิดตัวเดือนเมษายนกับเวอร์ชันโอเพ่นซอร์ส 14 พฤษภาคม TencentDB Agent Memory เปิดตัวครั้งแรกในปี 2026 แต่การเน้นฟีเจอร์แตกต่างกันในสองช่วง
เน้นระบบ หน่วยความจำระยะยาว
เปิดตัวสถาปัตยกรรม 4 ชั้น
แสดงผลทดสอบใน PersonaMem
การเปิดซอร์สเต็มรูปแบบ 14 พฤษภาคม
เปิดเผย stack ทั้งระบบเป็นโอเพ่นซอร์ส ภายใต้ MIT
เพิ่มระบบ บีบอัดหน่วยความจำระยะสั้นสำหรับงานยาว
ชูเทคนิค Context Offloading + Mermaid Task Canvas เป็นจุดเด่น
กล่าวสั้น ๆ คือ เวอร์ชันแรกเน้น “การจำระยะยาว” ส่วนเวอร์ชันโอเพ่นซอร์สเน้นแก้ปัญหา context window ล้นระหว่างงานจริง
การเชื่อมต่อกับ Agent Framework Tencent ระบุว่าระบบนี้สามารถทำงานร่วมกับเฟรมเวิร์กสำหรับเอเจนต์หลายตัว เช่น
OpenClaw (ใช้งานเป็นปลั๊กอินหน่วยความจำได้)
Hermes Gateway / Hermes Agent พร้อม deployment ผ่าน Docker
แนวทางนี้ช่วยให้นักพัฒนาสามารถเพิ่มระบบหน่วยความจำให้ agent ที่มีอยู่แล้ว โดยไม่ต้องออกแบบสถาปัตยกรรมใหม่ทั้งหมด
ทำไมเรื่องนี้สำคัญต่อการแข่งขันด้าน AI Agents เมื่อ AI agents เริ่มถูกนำไปใช้จริงในงานอย่าง
ผู้ช่วยเขียนโค้ด
ระบบค้นคว้าวิจัย
การทำ workflow อัตโนมัติในองค์กร
ต้นทุนของ context window และ token กลายเป็นข้อจำกัดสำคัญ
ห่วงโซ่ของการเรียกเครื่องมือหลายครั้งสามารถเพิ่มค่าใช้จ่ายอย่างรวดเร็ว และยังทำให้คุณภาพการให้เหตุผลลดลง
แนวทางของ Tencent พยายามแก้สองปัญหาพร้อมกัน
ลดต้นทุน: ใช้โทเคนน้อยลงสำหรับงานยาว
เพิ่มความเสถียร: ใช้โครงสร้างงานแบบแผนผังเพื่อให้เอเจนต์ไม่หลงทาง
หากแนวคิดนี้พิสูจน์ได้ในงานจริง ระบบหน่วยความจำแบบนี้อาจกลายเป็น ชั้นโครงสร้างพื้นฐานสำคัญของ AI agents รุ่นถัดไป
อย่างไรก็ตาม ผลลัพธ์ด้านประสิทธิภาพในปัจจุบันยังมาจากการทดสอบของ Tencent เอง และต้องรอดูการยืนยันจากการทดลองอิสระในอนาคต
news.futunn.com Tencent Cloud open-sources Agent Memory, reducing ...
Comments
0 comments