arXiv ID:
2606.13681
arXiv 提交日期: 2026-06-11
EvoArena:在动态环境中追踪记忆演化以实现稳健的LLM代理 / EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments
1️⃣ 一句话总结
这篇论文提出了一个名为EvoArena的基准测试平台,专门用于评估大语言模型代理在动态变化环境中的表现,并设计了一种基于补丁的记忆机制EvoMem,通过记录环境更新的结构化历史来帮助代理理解并适应变化,实验表明当前主流代理在此类场景下表现不佳,而EvoMem能显著提升其性能。