Tencent ने लॉन्ग‑टर्म मेमोरी को चार स्तरों में व्यवस्थित किया है ताकि कच्चे संवाद धीरे‑धीरे संरचित ज्ञान में बदल सकें।
L0: Raw Dialogue Layer
यह स्तर पूरी बातचीत और टास्क इंटरैक्शन को उसी रूप में संग्रहीत करता है जैसे वे हुए थे।
L1: Atomic Memory Layer
यहाँ बातचीत से महत्वपूर्ण तथ्य निकाले जाते हैं—जैसे उपयोगकर्ता की पसंद, सीमाएँ या किसी टास्क से निकले निष्कर्ष।
L2: Scenario Summary Layer
समान टास्क या परिस्थितियों से जुड़े अनुभवों को एक साथ जोड़कर सार बनाया जाता है।
L3: User Profile Layer
लंबे समय में उपयोगकर्ता के व्यवहार और पसंद को एक संक्षिप्त प्रोफ़ाइल में बदला जाता है।
इस प्रक्रिया से बिखरी बातचीत धीरे‑धीरे पुन: उपयोग योग्य ज्ञान में बदल जाती है। समय के साथ एजेंट पिछले अनुभवों का उपयोग करके वही काम दोबारा शुरू से करने की आवश्यकता कम कर सकते हैं।
TencentDB Agent Memory की सबसे बड़ी दक्षता इसी तकनीक से आती है, जो लंबे टास्क के दौरान शॉर्ट‑टर्म मेमोरी को संभालती है।
जब एजेंट कोई टूल कॉल करता है—जैसे वेबपेज डाउनलोड करना या कोड चलाना—तो उसका पूरा आउटपुट मॉडल के प्रॉम्प्ट में नहीं रखा जाता।
इसके बजाय:
Tencent ने टास्क की प्रगति दिखाने के लिए Mermaid नाम की टेक्स्ट‑आधारित डायग्राम भाषा का उपयोग किया है, जो डेवलपर डॉक्यूमेंटेशन में व्यापक रूप से इस्तेमाल होती है।
इस “टास्क कैनवास” में:
इस तरह मॉडल को हर संदेश याद रखने की बजाय सिर्फ टास्क का नक्शा समझना होता है। Tencent इसे एक सरल तुलना से समझाता है: लॉग्स रिकॉर्ड रखते हैं, लेकिन नक्शा रास्ता दिखाता है।
सिस्टम यह भी देखता रहता है कि कॉन्टेक्स्ट विंडो कितनी भर चुकी है और उसी आधार पर कम्प्रेशन लागू करता है।
आम तौर पर प्रक्रिया इस तरह काम करती है:
अगर उपयोग 95% के करीब पहुँच जाए तो सिस्टम आपात कम्प्रेशन लागू कर देता है ताकि कॉन्टेक्स्ट फिर से कम हो सके।
Tencent के अनुसार Agent Memory को एजेंट फ्रेमवर्क में जोड़ने से कई परीक्षणों में सुधार देखा गया। हालांकि ये परिणाम कंपनी द्वारा रिपोर्ट किए गए हैं और स्वतंत्र रूप से व्यापक परीक्षण अभी सीमित हैं।
WideSearch
SWE‑bench
AA‑LCR
PersonaMem
Tencent ने यह भी बताया कि कोड जनरेशन, वेब सर्च और दस्तावेज़ विश्लेषण जैसे 1,540 परीक्षण टास्क में कुल टास्क कम्प्लीशन 12–35% तक बढ़ा और टोकन उपयोग 33–64% तक घटा।
TencentDB Agent Memory को 2026 में पहले भी पेश किया गया था, लेकिन बाद की रिलीज़ में इसका फोकस बदल गया।
अप्रैल लॉन्च
14 मई ओपन‑सोर्स रिलीज़
संक्षेप में, शुरुआती संस्करण का लक्ष्य एजेंट की दीर्घकालिक याददाश्त था, जबकि बाद की रिलीज़ ने लंबे टास्क के दौरान कॉन्टेक्स्ट ओवरलोड को हल करने पर ध्यान दिया।
Tencent के अनुसार यह सिस्टम कुछ लोकप्रिय एजेंट फ्रेमवर्क के साथ पहले से काम करता है। उदाहरण के लिए:
इससे डेवलपर्स अपने मौजूदा एजेंट सिस्टम को पूरी तरह दोबारा डिज़ाइन किए बिना मेमोरी और कॉन्टेक्स्ट कम्प्रेशन जोड़ सकते हैं।
जैसे‑जैसे AI एजेंट प्रयोगात्मक डेमो से वास्तविक उत्पादों—जैसे कोडिंग असिस्टेंट, रिसर्च एजेंट और एंटरप्राइज़ ऑटोमेशन—की ओर बढ़ रहे हैं, कॉन्टेक्स्ट विंडो की लागत और सीमाएँ एक बड़ी चुनौती बन रही हैं।
Tencent का दृष्टिकोण दो समस्याओं को साथ हल करने की कोशिश करता है:
अगर ये परिणाम बड़े पैमाने पर स्वतंत्र परीक्षणों में भी सही साबित होते हैं, तो TencentDB Agent Memory जैसे सिस्टम भविष्य के स्वायत्त AI एजेंट इंफ्रास्ट्रक्चर का महत्वपूर्ण हिस्सा बन सकते हैं। फिलहाल, इनके प्रदर्शन दावे मुख्यतः Tencent द्वारा रिपोर्ट किए गए परीक्षणों पर आधारित हैं।
Comments
0 comments