arXiv ID:
2607.01754
arXiv 提交日期: 2026-07-02
路径级后见指令:用于视觉语言导航中的语义探索 / Path-level Hindsight Instructions for Semantic Exploration in Vision-Language Navigation
1️⃣ 一句话总结
本文提出Phi-Nav框架,通过在智能体探索轨迹后自动生成与路径匹配的语言指令,将无标签的探索数据转化为有效的训练样本,从而在减少专家演示数据需求的同时,显著提升了视觉语言导航任务的性能。