arXiv ID:
2602.20119
arXiv 提交日期: 2026-02-23
NovaPlan:通过闭环视频语言规划实现零样本长程操作 / NovaPlan: Zero-Shot Long-Horizon Manipulation via Closed-Loop Video Language Planning
1️⃣ 一句话总结
这篇论文提出了一个名为NovaPlan的分层机器人框架,它结合了视觉语言模型和视频生成模型进行任务分解与规划,并利用从视频中提取的关键点信息来指导机器人动作,从而无需额外训练就能完成复杂的长程操作任务并自主纠正执行错误。