arXiv ID:
2605.18734
arXiv 提交日期: 2026-05-18
EgoExoMem:同步第一人称与第三人称视频的跨视角记忆推理 / EgoExoMem: Cross-View Memory Reasoning over Synchronized Egocentric and Exocentric Videos
1️⃣ 一句话总结
本文提出了一个名为EgoExoMem的新基准,用于测试AI模型在同步的第一人称(亲眼所见)和第三人称(旁观者视角)视频中,结合两种视角进行时空记忆推理的能力,并设计了E²-Select方法,无需训练即可高效筛选双视角视频帧,实验表明现有模型表现远未达到人类水平,且存在视角偏好冲突问题。