arXiv ID:
2601.04745
arXiv 提交日期: 2026-01-08
KnowMe-Bench:面向终身数字伴侣的人物理解基准测试 / KnowMe-Bench: Benchmarking Person Understanding for Lifelong Digital Companions
1️⃣ 一句话总结
这篇论文提出了一个名为KnowMe-Bench的新基准测试,它使用真实的长篇自传体叙事来评估AI模型对人的深层次理解能力,发现当前基于检索的系统主要提升了事实记忆,但在解释时间关联和进行高级推理方面仍有不足,揭示了未来数字伴侣需要更先进的记忆机制。