arXiv ID:
2604.07957
WorldMAP:利用生成式世界模型自举提升视觉语言导航轨迹预测 / WorldMAP: Bootstrapping Vision-Language Navigation Trajectory Prediction with Generative World Models
1️⃣ 一句话总结
这篇论文提出了一个名为WorldMAP的新方法,它巧妙地利用生成式世界模型来‘想象’未来的环境画面,并从中提取出结构化的导航指导信息,从而训练出一个更轻量、更准确的视觉语言模型,使其仅凭单次观察就能预测出稳定可靠的导航路线。