Memory in the Age of AI Agents

📄 Abstract - Memory in the Age of AI Agents

Memory has emerged, and will continue to remain, a core capability of foundation model-based agents. As research on agent memory rapidly expands and attracts unprecedented attention, the field has also become increasingly fragmented. Existing works that fall under the umbrella of agent memory often differ substantially in their motivations, implementations, and evaluation protocols, while the proliferation of loosely defined memory terminologies has further obscured conceptual clarity. Traditional taxonomies such as long/short-term memory have proven insufficient to capture the diversity of contemporary agent memory systems. This work aims to provide an up-to-date landscape of current agent memory research. We begin by clearly delineating the scope of agent memory and distinguishing it from related concepts such as LLM memory, retrieval augmented generation (RAG), and context engineering. We then examine agent memory through the unified lenses of forms, functions, and dynamics. From the perspective of forms, we identify three dominant realizations of agent memory, namely token-level, parametric, and latent memory. From the perspective of functions, we propose a finer-grained taxonomy that distinguishes factual, experiential, and working memory. From the perspective of dynamics, we analyze how memory is formed, evolved, and retrieved over time. To support practical development, we compile a comprehensive summary of memory benchmarks and open-source frameworks. Beyond consolidation, we articulate a forward-looking perspective on emerging research frontiers, including memory automation, reinforcement learning integration, multimodal memory, multi-agent memory, and trustworthiness issues. We hope this survey serves not only as a reference for existing work, but also as a conceptual foundation for rethinking memory as a first-class primitive in the design of future agentic intelligence.

AI智能体时代的记忆：综述 / Memory in the Age of AI Agents

1️⃣ 一句话总结

本文系统性地综述了基于大语言模型的智能体记忆研究，提出了一个从形式、功能和动态三个维度统一分析智能体记忆的新框架，旨在澄清领域内碎片化的概念，并为未来的研究和系统设计提供清晰的理论基础。

2️⃣ 论文创新点

1. 统一的三维分析框架

创新点：提出了从“形式”、“功能”和“动态”三个统一视角来系统审视和分析智能体记忆的框架。形式维度关注记忆的实现架构，功能维度关注记忆在认知过程中的作用，动态维度关注记忆随时间的形成、演化和检索过程。
区别/改进：超越了传统基于时间（长/短期）的粗粒度分类，提供了一个更全面、结构化的分析维度，能够更好地描述现代智能体记忆系统的多样性和动态性。
意义：为理解和比较纷繁复杂的智能体记忆研究提供了一个清晰、统一的概念基础和分析框架，有助于该领域的系统化发展。

2. 细粒度的功能分类法

创新点：在功能维度上，提出了将智能体记忆细分为事实记忆、经验记忆和工作记忆的更精细分类。事实记忆存储静态知识，经验记忆存储交互经验，工作记忆支持当前任务的短期活跃信息处理。
区别/改进：改进了仅基于时间维度的传统分类，能够更精确地描述记忆在智能体认知过程中的不同作用，明确了不同类型记忆在支持推理、学习和决策中的具体功能。
意义：有助于更精细地设计和评估智能体记忆系统，指导针对具体任务的高效记忆系统构建。

3. 基于时间调用模式的记忆效应解释

创新点：提出智能体记忆的效应（如短期/长期记忆）并非由固定的架构模块决定，而是由记忆生命周期操作（形成F、演化E、检索R）在任务执行过程中的不同时间调用模式所产生。
区别/改进：将记忆现象从静态的模块化设计转向动态的、基于时间模式的灵活调用，为理解和设计记忆系统提供了新的视角。
意义：统一解释了不同记忆系统（从轻量日志到复杂提炼）的行为差异，为构建更灵活、高效的智能体记忆框架奠定了理论基础。

4. 智能体记忆的概念澄清与定位

创新点：明确区分了智能体记忆与易混淆的概念，如LLM内部记忆、检索增强生成和上下文工程。指出智能体记忆的核心在于维持一个持久且自我演化的认知状态，它整合了事实知识和经验。
区别/改进：澄清了文献和实践中的概念模糊性，将历史上一些被称为“LLM记忆”的工作重新定位为早期智能体记忆的实例，为领域建立了更清晰的概念边界。
意义：为未来的研究和系统设计提供了清晰的指导，避免了技术路线的混淆，促进了该领域的健康发展。

3️⃣ 主要结果与价值

结果亮点

论文框架成功地将大量现有研究（如MemoryBank, MemGPT, Mem0, A-MEM, Zep等）纳入到“形式-功能-动态”的三维分类体系中，验证了其普适性和解释力。
通过分析不同记忆形式（如Token-level, Parametric, Latent memory）与功能（事实、经验、工作记忆）的适配性，为针对特定任务设计高效记忆系统提供了实践见解。
探讨了RAG技术在智能体记忆系统中的映射关系（如模块化RAG对应检索阶段，图RAG对应图结构记忆），揭示了技术共享性，为系统设计提供了参考框架。

实际价值

为AI智能体开发者提供了一个系统化的设计蓝图，指导他们如何根据任务需求（如单次推理 vs. 多轮交互、环境适应）选择和构建合适的记忆系统。
通过澄清智能体记忆与RAG、上下文工程等技术的区别与联系，帮助实践者更准确地选择技术栈，避免误用和资源浪费。
总结的代表性基准和开源框架资源，为研究人员和工程师快速入门、评估和构建智能体记忆系统提供了宝贵的参考和工具。

4️⃣ 术语表

Forms (形式)：指智能体记忆的实现形式。本文识别了三种主要形式：Token-level memory（基于文本/标记的记忆）、Parametric memory（参数化记忆，如模型权重更新）和Latent memory（潜在记忆，如向量嵌入）。
Functions (功能)：指智能体记忆所扮演的角色或功能。本文提出了一个细粒度分类：Factual memory（存储事实知识）、Experiential memory（存储交互经验）和Working memory（支持当前任务的短期、活跃记忆）。
Agent Memory (智能体记忆)：指在LLM驱动的智能体系统中，用于维持一个持久且自我演化的认知状态，它整合了事实知识和经验，并通过形成、演化、检索等操作在时间上灵活调用的机制。区别于LLM内部记忆。
Forms–Functions–Dynamics triangle (形式-功能-动态三角)：本文提出的用于结构化分析智能体记忆的框架，分别对应记忆的架构实现形式、功能角色以及生命周期和操作动态。
LLM-based agent systems (基于大语言模型的智能体系统)：作为交互系统决策核心的、在时间上运行、操作外部工具、并与人类或其他智能体协调的，基于大语言模型的智能体系统。
轨迹：智能体系统完整执行过程中产生的状态、观察、动作序列，反映了环境观察、记忆检索、LLM计算和动作执行的交织过程。
记忆演化：将新形成的记忆候选整合到现有记忆库中的操作，可能包括合并冗余条目、解决冲突、丢弃低效用信息或重组记忆以优化检索。
Temporal Roles (F, E, R) (时间角色)：记忆生命周期中的时间角色，包括记忆形成、记忆演化和记忆检索。它们不同的调用模式决定了短期或长期等记忆效应的产生。
RAG (检索增强生成)：检索增强生成，一种通过访问静态知识源来增强大语言模型的技术，旨在基于最新事实生成内容、减少幻觉并提高知识准确性，主要用于单次推理任务。
Agentic RAG (智能体RAG)：智能体检索增强生成，一种将检索集成到自主决策循环中的系统，LLM智能体主动控制检索的时机、方式和内容，支持迭代查询、多步规划或自导向搜索。
Context Engineering (上下文工程)：上下文工程，一种系统化的设计方法论，将上下文窗口视为受限制的计算资源，并优化信息负载以缓解大输入容量与模型生成能力之间的不对称，属于外部脚手架。

← 返回列表

菜单

AI 帮我研读全文

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 统一的三维分析框架

2. 细粒度的功能分类法

3. 基于时间调用模式的记忆效应解释

4. 智能体记忆的概念澄清与定位

3️⃣ 主要结果与价值

结果亮点

实际价值

4️⃣ 术语表

密码管理

设置密码

修改密码

移除密码

菜单

AI 帮我研读全文

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 统一的三维分析框架

2. 细粒度的功能分类法

3. 基于时间调用模式的记忆效应解释

4. 智能体记忆的概念澄清与定位

3️⃣ 主要结果与价值

结果亮点

实际价值

4️⃣ 术语表

获取最新论文摘要