arXiv ID:
2605.18746
arXiv 提交日期: 2026-05-18
ESI-Bench:迈向闭环感知-动作的具身空间智能评估基准 / ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop
1️⃣ 一句话总结
本文提出了一个名为ESI-Bench的具身空间智能基准测试,强调智能体必须通过主动探索(如移动和操作)来获取空间信息,从而完成从被动感知到主动推理的闭环,实验表明当前先进模型虽然能自发学习探索策略,但普遍存在“动作盲视”问题——错误动作导致错误观察并引发连锁错误,且缺乏人类那种根据矛盾证据调整信念的元认知能力。