arXiv ID:
2512.08186
arXiv 提交日期: 2025-12-09
慢思考,快行动:一种用于泛化视觉语言导航的双系统基础模型 / Ground Slow, Move Fast: A Dual-System Foundation Model for Generalizable Vision-and-Language Navigation
1️⃣ 一句话总结
这篇论文提出了一个名为DualVLN的双系统模型,它通过一个慢速思考的全局规划器来设定中期目标,再驱动一个快速行动的本地控制器来生成平滑轨迹,从而在复杂动态环境中实现了更鲁棒、更高效的视觉语言导航。