arXiv ID:
2601.15282
为具身世界重新思考视频生成模型 / Rethinking Video Generation Model for the Embodied World
1️⃣ 一句话总结
这篇论文通过创建一个名为RBench的标准化机器人视频生成评测基准和一个包含400万标注视频片段的大型开源数据集RoVid-X,旨在解决现有模型难以生成物理真实机器人行为的问题,为具身人工智能的发展提供了评估和训练的基础。