arXiv ID:
2603.08007
arXiv 提交日期: 2026-03-09
ViSA增强的空中视觉语言导航:一个视觉-空间推理增强的框架 / ViSA-Enhanced Aerial VLN: A Visual-Spatial Reasoning Enhanced Framework for Aerial Vision-Language Navigation
1️⃣ 一句话总结
这篇论文提出了一种新的视觉-空间推理增强框架,通过结构化视觉提示让视觉语言模型直接在图像上进行推理,无需额外训练,从而显著提升了无人机根据语言指令导航的成功率。