arXiv ID:
2606.24595
arXiv 提交日期: 2026-06-23
MEMPROBE:通过隐藏用户状态恢复探测长期智能体记忆 / MEMPROBE: Probing Long-Term Agent Memory via Hidden User-State Recovery
1️⃣ 一句话总结
本文提出一种名为MEMPROBE的全新评估方法,不再仅通过任务完成率等间接指标衡量AI助手的长期记忆能力,而是直接检查助手使用后留下的记忆痕迹能否准确还原用户的隐藏信息(如偏好、身份等),并发现现有记忆系统在精确恢复用户状态方面表现有限,与任务表现之间存在显著差距。