arXiv最新AI论文速览速学

🔍

标签: #memory management ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: MemRefine: LLM-Guided Compression for Long-Term Agent Memory 06-12

arXiv ID: 2606.13177

arXiv 提交日期: 2026-06-11

llm agents systems memory management long-term interaction compression budgeted storage retrieval

MemRefine：基于大语言模型的长期智能体记忆压缩方法 / MemRefine: LLM-Guided Compression for Long-Term Agent Memory

1️⃣ 一句话总结

本文提出一种名为MemRefine的框架，利用大语言模型作为智能裁判，通过分析事实内容而非表面相似性，智能地合并或删除冗余的记忆条目，在固定存储预算下保留最有价值的信息，从而高效管理长期对话智能体的记忆。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09365

arXiv 提交日期: 2026-06-08

medical agents machine learning skill memory self-evolution clinical reasoning memory management reinforcement learning

经验成就技能：通过自我进化的技能记忆实现可泛化的医疗智能体推理 / Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

1️⃣ 一句话总结

本文提出了一种名为SkeMex的框架，让医疗AI智能体在部署后能像人一样从过往交互中自动提炼出结构化“技能”并不断更新记忆库，从而在不修改模型参数的前提下，更高效、更可靠地应对复杂的临床决策任务，并显著提升在不同任务和模型上的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18002

arXiv 提交日期: 2026-04-20

llm reinforcement learning model training chain-of-thought kv cache compression memory management eviction policy reasoning efficiency

神经网络垃圾回收：在推理中学习遗忘 / Neural Garbage Collection: Learning to Forget while Learning to Reason

1️⃣ 一句话总结

本文提出一种名为“神经网络垃圾回收”的方法，让语言模型在通过强化学习进行端到端推理的同时，自主学会有选择地丢弃KV缓存中的信息，从而在保持高准确率的前提下将峰值缓存占用压缩2到3倍，解决了长链推理中内存瓶颈问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.02280

arXiv 提交日期: 2026-04-02

agents systems natural language processing memory management forgetting mechanisms conversational agents long-horizon reasoning adaptive memory

面向自主AI智能体的新型记忆遗忘技术：平衡相关性与效率 / Novel Memory Forgetting Techniques for Autonomous AI Agents: Balancing Relevance and Efficiency

1️⃣ 一句话总结

这篇论文提出了一种自适应的、有预算的记忆遗忘框架，通过智能地选择性地遗忘不重要的旧记忆，让长期对话AI在保持推理能力的同时，避免因记忆无限增长而导致的性能下降和错误记忆问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10652

arXiv 提交日期: 2026-02-11

llm agents model training memory extraction memory management self-evolving agents generalization reinforcement learning

UMEM：面向可泛化记忆的统一记忆提取与管理框架 / UMEM: Unified Memory Extraction and Management Framework for Generalizable Memory

1️⃣ 一句话总结

这篇论文提出了一个名为UMEM的统一框架，通过联合优化记忆提取和管理过程，并引入语义邻域建模来防止模型过拟合到具体实例，从而让基于大语言模型的智能体能够积累更具泛化性和鲁棒性的记忆，在多项任务中显著提升了性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14192

arXiv 提交日期: 2026-01-20

agents llm systems agent efficiency memory management tool learning planning evaluation metrics

迈向高效智能体：记忆、工具学习与规划 / Toward Efficient Agents: Memory, Tool learning, and Planning

1️⃣ 一句话总结

这篇论文系统性地探讨了如何提升基于大语言模型的智能体在实际应用中的运行效率，重点从记忆管理、工具调用和决策规划这三个核心环节入手，分析了当前提升效率的主流方法、评估指标以及未来面临的挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.11969

arXiv 提交日期: 2026-01-17

llm model evaluation benchmark reward models long-term memory long-context evaluation benchmark memory management

MemoryRewardBench：用于评估大语言模型长期记忆管理能力的奖励模型基准 / $\texttt{MemoryRewardBench}$: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

1️⃣ 一句话总结

这篇论文提出了首个专门用于评估奖励模型对大语言模型长期记忆管理能力进行自动评分的基准测试，发现开源模型与闭源模型的性能差距正在缩小，并揭示了当前奖励模型在此任务上的能力与局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05107

arXiv 提交日期: 2026-01-08

llm agents systems memory management long-term interaction personalization controllable ai human-agent collaboration

可控内存使用：在长期人机交互中平衡记忆锚定与创新 / Controllable Memory Usage: Balancing Anchoring and Innovation in Long-Term Human-Agent Interaction

1️⃣ 一句话总结

这篇论文提出了一个名为SteeM的智能体框架，它允许用户像调节旋钮一样动态控制AI对过去交互记忆的依赖程度，从而在长期互动中灵活平衡遵循历史风格与激发新创意，避免了要么全记要么全忘的僵化策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.12967

arXiv 提交日期: 2025-12-15

llm model training systems long-context reasoning post-training reinforcement learning memory management data synthesis

QwenLong-L1.5：通过系统性后训练创新实现卓越的长上下文推理能力 / QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

1️⃣ 一句话总结

本文提出了QwenLong-L1.5模型，通过一套整合了高质量数据合成、稳定强化学习训练和超长上下文记忆增强架构的系统性后训练方案，显著提升了模型在长上下文推理任务上的性能，使其在多个基准测试中达到与顶尖模型相当的水平。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.04515

arXiv 提交日期: 2025-12-04

video generation multi-modal model training egocentric video long-context diffusion memory management temporal consistency world models

EgoLCD：基于长上下文扩散模型的第一人称视角视频生成 / EgoLCD: Egocentric Video Generation with Long Context Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为EgoLCD的新方法，通过巧妙地管理长期和短期记忆来生成连贯、高质量的第一人称视角长视频，有效解决了现有模型在生成过程中容易出现的画面内容漂移和遗忘问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.13177

1️⃣ 一句话总结

arXiv ID: 2606.09365

1️⃣ 一句话总结

arXiv ID: 2604.18002

1️⃣ 一句话总结

arXiv ID: 2604.02280

1️⃣ 一句话总结

arXiv ID: 2602.10652

1️⃣ 一句话总结

arXiv ID: 2601.14192

1️⃣ 一句话总结

arXiv ID: 2601.11969

1️⃣ 一句话总结

arXiv ID: 2601.05107

1️⃣ 一句话总结

arXiv ID: 2512.12967

1️⃣ 一句话总结

arXiv ID: 2512.04515

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.13177 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09365 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18002 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.02280 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10652 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14192 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.11969 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05107 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.12967 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.04515 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.13177

arXiv ID: 2606.09365

arXiv ID: 2604.18002

arXiv ID: 2604.02280

arXiv ID: 2602.10652

arXiv ID: 2601.14192

arXiv ID: 2601.11969

arXiv ID: 2601.05107

arXiv ID: 2512.12967

arXiv ID: 2512.04515