arXiv ID:
2603.09512
探究驾驶视觉语言模型的可靠性:从不一致响应到基于时间的推理 / Probing the Reliability of Driving VLMs: From Inconsistent Responses to Grounded Temporal Reasoning
1️⃣ 一句话总结
这篇论文研究发现,当前用作驾驶助手的视觉语言模型存在回答不稳定和缺乏时间推理能力的问题,作者通过创建新数据集并提出一种自我监督的改进方法,旨在提升模型在驾驶场景中的可靠决策能力。