arXiv ID:
2604.10981
arXiv 提交日期: 2026-04-13
ATANT v1.1:针对记忆、长上下文和智能体记忆基准的连续性定位评估 / ATANT v1.1: Positioning Continuity Evaluation Against Memory, Long-Context, and Agentic-Memory Benchmarks
1️⃣ 一句话总结
这篇论文通过系统分析指出,当前流行的多种AI记忆评估基准(如LOCOMO、LongMemEval等)实际上都无法有效衡量AI系统在长对话或故事中保持信息连贯性的核心能力,并呼吁学界应更精准地投资于真正的连续性评估研究。