arXiv ID:
2605.13335
arXiv 提交日期: 2026-05-13
Ego2World:将第一人称烹饪视频编译为可执行世界,用于信念状态规划 / Ego2World: Compiling Egocentric Cooking Videos into Executable Worlds for Belief-State Planning
1️⃣ 一句话总结
本文提出Ego2World,一个将真实第一人称烹饪视频转化为可执行符号世界的新基准,用于测试智能体在部分可观察环境中通过维护信念(记忆)来规划行动的能力,实验表明基于持久信念记忆的策略比依赖重叠分数的方法更有效。