arXiv ID:
2603.03781
arXiv 提交日期: 2026-03-04
LifeBench:一个面向长周期多源记忆的基准测试 / LifeBench: A Benchmark for Long-Horizon Multi-Source Memory
1️⃣ 一句话总结
这篇论文提出了一个名为LifeBench的新基准测试,它通过模拟密集关联的长周期事件来挑战AI智能体,要求其不仅回忆显性知识,还需从多种数字痕迹中推理出习惯性和程序性等非显性记忆,从而更真实地评估智能体在长期、多源记忆整合方面的能力。