arXiv ID:
2601.05241
arXiv 提交日期: 2026-01-08
RoboVIP:通过视觉身份提示生成多视角视频以增强机器人操作 / RoboVIP: Multi-View Video Generation with Visual Identity Prompting Augments Robot Manipulation
1️⃣ 一句话总结
这篇论文提出了一种名为RoboVIP的新方法,它通过向图像生成模型提供示例图片作为视觉引导,来批量生成多视角、时间连贯的机器人操作视频数据,从而有效提升机器人策略模型的训练效果。