arXiv ID:
2601.08665
arXiv 提交日期: 2026-01-13
VLingNav:基于自适应推理与视觉辅助语言记忆的具身导航 / VLingNav: Embodied Navigation with Adaptive Reasoning and Visual-Assisted Linguistic Memory
1️⃣ 一句话总结
这篇论文提出了一个名为VLingNav的智能体导航模型,它通过模拟人类思考方式,在需要时才进行深度推理,并利用语言记忆记住环境信息,从而在复杂、长距离的导航任务中表现出色,且能直接应用于真实机器人。