RespostasPublicadohá 2 mesesLast edited mês passado15 fontes

TencentDB Agent Memory: o sistema de memória em camadas que torna agentes de IA mais baratos e confiáveis

A Tencent Cloud abriu o código do TencentDB Agent Memory, um mecanismo de memória para agentes de IA que promete reduzir o uso de tokens em até 61% em tarefas longas. A solução combina memória de longo prazo em quatro camadas com compressão de contexto via “Context Offloading” e um mapa de tarefas em Mermaid que man...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

Conceptual illustration of TencentDB Agent Memory showing layered AI memory and task graph compression — What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + MermaiTencentDB Agent Memory uses layered memory and a structured task graph to compress agent context and reduce token consumption.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What is Tencent Cloud’s newly open-sourced TencentDB Agent Memory, how does its layered memory architecture and “Context Offloading + Mermai. Article summary: TencentDB Agent Memory is Tencent Cloud’s open-source memory layer for AI agents: it combines long-term personalized memory with short-term context compression so agents can run longer tasks without stuffing every tool r. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "3 weeks ago - Tencent Cloud’s Cube Sandbox goes fully open source with five technical breakthroughs, providing a production-grade foundation for AI Agent deployment at industrial s" source context "Tencent Cloud Cube Sandbox Goes Fully Open-Source, with Five Major Breakthroughs Enabling Large-Scale Agent Deployment -" Reference
openai.com

Agentes de IA enfrentam um problema estrutural: o limite da janela de contexto. Quanto mais longa e complexa é uma tarefa — como pesquisar na web, escrever código ou analisar documentos — mais logs, resultados de ferramentas e etapas intermediárias precisam entrar no prompt do modelo. Isso aumenta rapidamente o consumo de tokens e pode prejudicar o raciocínio do sistema.

Para lidar com esse gargalo, a Tencent Cloud abriu o código do TencentDB Agent Memory em maio de 2026. A proposta é oferecer uma camada de memória para agentes de IA que combine memória persistente entre sessões com compressão inteligente do contexto durante tarefas longas. Em testes internos da empresa, o sistema reduziu o consumo de tokens em até 61%, além de melhorar a taxa de sucesso em tarefas complexas.

O que é o TencentDB Agent Memory

O TencentDB Agent Memory é um motor de memória open source voltado para agentes de IA que executam fluxos de trabalho longos e com várias etapas. O projeto foi publicado sob licença MIT, permitindo uso e adaptação por desenvolvedores e empresas.

O objetivo principal é permitir que agentes:

lembrem preferências e comportamentos do usuário
mantenham o estado de tarefas complexas
evitem inserir grandes volumes de dados brutos no contexto do modelo

Em vez de reenviar todo resultado de busca, logs ou mensagens intermediárias ao modelo, o sistema organiza e resume essas informações em camadas estruturadas de memória.

Arquitetura de memória em quatro camadas

A memória de longo prazo do sistema segue um modelo progressivo com quatro níveis que transformam conversas brutas em conhecimento estruturado.

L0 — Camada de diálogo bruto
Armazena todas as interações e conversas exatamente como ocorreram.

L1 — Memória atômica
Extrai fatos estruturados dessas interações, como preferências do usuário, restrições ou conclusões de etapas anteriores.

L2 — Resumo de cenários
Agrupa memórias relacionadas a um determinado tipo de tarefa ou contexto.

L3 — Perfil do usuário
Consolida padrões de comportamento e preferências de longo prazo em um perfil compacto.

Na prática, esse processo transforma registros dispersos em conhecimento reutilizável, permitindo que o agente aproveite experiências passadas em vez de recalcular tudo novamente.

A inovação central: Context Offloading + Mermaid Task Canvas

O principal ganho de eficiência aparece na forma como o sistema lida com memória de curto prazo durante tarefas longas.

Context Offloading

Quando o agente executa uma ação — como buscar uma página ou rodar código — o resultado completo é armazenado fora do prompt, em armazenamento externo.

Dentro do contexto do modelo permanece apenas:

um resumo compacto
ou uma referência ao conteúdo original

Assim, grandes volumes de dados não ocupam permanentemente espaço na janela de contexto.

Mermaid Task Canvas

Em vez de manter um histórico textual extenso, o sistema representa o progresso da tarefa usando um grafo estruturado escrito em Mermaid, uma linguagem de diagramas baseada em texto muito usada em documentação técnica.

Esse “canvas de tarefas” funciona como um mapa do fluxo de trabalho:

nós representam etapas
conexões mostram dependências
cada nó contém um pequeno resumo ou estado

Com isso, o modelo precisa raciocinar apenas sobre a estrutura da tarefa, não sobre todo o histórico detalhado de mensagens. Isso reduz drasticamente o número de tokens necessários.

A própria Tencent resume a ideia com uma analogia: logs registram tudo, mas mapas ajudam a navegar. O canvas Mermaid funciona como esse mapa para o agente.

Compressão adaptativa baseada no “nível” do contexto

O sistema também ajusta automaticamente o nível de compressão conforme o prompt se aproxima do limite da janela de contexto.

Alguns marcos típicos incluem:

Resumo em tempo real (L1): saídas de ferramentas são resumidas logo após a execução.
Atualização do canvas (L2): o mapa de tarefas em Mermaid é atualizado de forma assíncrona.
Compressão profunda (L3): quando o uso do contexto chega a cerca de 80%, mensagens antigas são fortemente comprimidas ou removidas.

Se o uso ultrapassar aproximadamente 95%, o sistema executa uma compressão emergencial para liberar espaço novamente.

Resultados de benchmark divulgados pela Tencent

Nos testes internos da empresa, a integração do Agent Memory em frameworks de agentes trouxe ganhos relevantes. Esses números são resultados reportados pelo fornecedor, não benchmarks independentes.

WideSearch

taxa de sucesso: 33% → 50%
uso de tokens: 221,31M → 85,64M (redução de 61,38%)

SWE-bench

sucesso: 58,4% → 64,2%
tokens: 3474,1M → 2375,4M (−33,09%)

AA-LCR

sucesso: 44,0% → 47,5%
tokens: 112,0M → 77,3M (−30,98%)

PersonaMem

precisão aproximada: 48% → 76% após adicionar o sistema de memória.

Em um conjunto mais amplo de 1.540 tarefas — incluindo geração de código, pesquisa na web e análise de documentos — a Tencent afirma ter observado aumento de 12% a 35% na conclusão de tarefas, com redução de 33% a 64% no consumo de tokens.

O que mudou entre o lançamento de abril e o release de 14 de maio

O projeto passou por duas fases em 2026.

Abril (lançamento inicial)

introdução do sistema de memória de longo prazo
arquitetura de quatro camadas
foco em lembrar preferências e experiências entre sessões

14 de maio (open source completo)

liberação do stack completo em código aberto sob licença MIT
inclusão do sistema de compressão de memória de curto prazo
destaque para o mecanismo Context Offloading + Mermaid Task Canvas

Ou seja, a primeira versão priorizava memória persistente; a segunda focou em resolver o problema da janela de contexto em tarefas longas.

Integração com frameworks de agentes

A Tencent afirma que o sistema já pode ser usado com alguns frameworks populares de agentes.

Entre eles:

OpenClaw, onde funciona como um plugin de memória
Hermes Gateway / Hermes Agent, com suporte a implantação via Docker a partir da versão 0.3.4

Isso permite adicionar memória estruturada e compressão de contexto a arquiteturas existentes sem redesenhar todo o sistema.

Por que isso importa para a corrida dos agentes de IA

À medida que agentes de IA deixam de ser demos e passam a executar tarefas reais — como programação, pesquisa e automação de fluxos corporativos — o custo da janela de contexto virou um dos principais gargalos técnicos.

Cadeias longas de chamadas de ferramentas podem inflar o uso de tokens e dificultar que o modelo mantenha coerência ao longo da tarefa.

A abordagem da Tencent tenta atacar dois pontos ao mesmo tempo:

Custo: menos tokens significam operação mais barata.
Confiabilidade: uma memória estruturada ajuda o agente a manter direção em tarefas complexas.

Se esses resultados se confirmarem em testes independentes, sistemas como o TencentDB Agent Memory podem se tornar infraestrutura fundamental para agentes autônomos de próxima geração. Por enquanto, porém, os ganhos divulgados ainda dependem de validação mais ampla fora dos testes da própria empresa.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "TencentDB Agent Memory: o sistema de memória em camadas que torna agentes de IA mais baratos e confiáveis" là gì?

A Tencent Cloud abriu o código do TencentDB Agent Memory, um mecanismo de memória para agentes de IA que promete reduzir o uso de tokens em até 61% em tarefas longas.

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Benchmarks divulgados pela empresa indicam maior taxa de sucesso em tarefas e forte redução de custos de tokens, embora os resultados ainda sejam relatados pela própria Tencent.

Fontes

← Back to Trending