arXiv ID:
2512.06963
arXiv 提交日期: 2025-12-07
VideoVLA:视频生成模型可作为通用机器人操作器 / VideoVLA: Video Generators Can Be Generalizable Robot Manipulators
1️⃣ 一句话总结
这篇论文提出了VideoVLA方法,通过将大型视频生成模型改造为机器人操作器,使其能根据语言指令和当前图像,同时预测未来的动作序列和视觉结果,从而显著提升了机器人在新任务、新物体和新环境中的泛化能力。