arXiv ID:
2604.08457
arXiv 提交日期: 2026-04-09
CrashSight:一个面向交通碰撞场景理解与推理的、分阶段的、以基础设施为中心的视觉基准 / CrashSight: A Phase-Aware, Infrastructure-Centric Video Benchmark for Traffic Crash Scene Understanding and Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为CrashSight的大规模基准数据集,它利用真实世界的路边摄像头视频来评估视觉语言模型在理解和推理交通碰撞场景(包括原因、过程和结果)方面的能力,发现现有模型在关键安全场景的时序和因果推理上仍有不足。