arXiv ID:
2604.20006
arXiv 提交日期: 2026-04-21
从回忆到遗忘:为个性化智能体评测长期记忆能力 / From Recall to Forgetting: Benchmarking Long-Term Memory for Personalized Agents
1️⃣ 一句话总结
这篇论文提出了一个名为Memora的长期记忆评测基准,通过记忆、推理和推荐三类任务,以及一个惩罚使用过时信息的新指标FAMA,揭示了当前大语言模型和记忆智能体在持续对话中难以更新和遗忘无效记忆的严重缺陷。