arXiv ID:
2606.23127
arXiv 提交日期: 2026-06-22
大型语言模型智能体中的程序记忆管理:控制、适应与评估 / Managing Procedural Memory in LLM Agents: Control, Adaptation, and Evaluation
1️⃣ 一句话总结
本文提出了一个名为AFTER的基准测试,用于评估智能体在重复工作场景中利用程序记忆学习技能的效果,结果表明程序记忆能显著提升任务表现,不同技能在不同任务和模型间的迁移能力存在差异。