arXiv ID:
2602.09878
arXiv 提交日期: 2026-02-10
MVISTA-4D:用于机器人操作的具有测试时动作推理能力的视角一致四维世界模型 / MVISTA-4D: View-Consistent 4D World Model with Test-Time Action Inference for Robotic Manipulation
1️⃣ 一句话总结
这篇论文提出了一个名为MVISTA-4D的新型机器人世界模型,它能够仅凭单视角的RGBD图像,就生成几何一致、多视角的未来场景动态,并通过一种创新的测试时动作优化方法,将这些预测的未来转化为机器人可执行的精确动作。