arXiv ID:
2604.04564
arXiv 提交日期: 2026-04-06
基于视觉提示与多模态大语言模型的越野地图构建推理方法 / Visual Prompt Based Reasoning for Offroad Mapping using Multimodal LLMs
1️⃣ 一句话总结
这篇论文提出了一种创新的零样本方法,它利用一个视觉语言大模型,通过分析标注了数字标签的越野环境分割图像,直接推理出可通行区域,从而替代了传统需要多个专门模型协同工作的复杂方案,实现了更高效的越野自主导航。