arXiv ID:
2602.10719
arXiv 提交日期: 2026-02-11
从表征互补到双系统:协同视觉语言模型与纯视觉骨干网络实现端到端驾驶 / From Representational Complementarity to Dual Systems: Synergizing VLM and Vision-Only Backbones for End-to-End Driving
1️⃣ 一句话总结
这篇论文发现,在自动驾驶系统中,结合了语言理解的视觉模型和纯视觉模型在决策行为上存在互补性,并据此设计了一个高效的双系统框架,让系统能根据场景智能选择使用哪种模型,从而在保证性能的同时大幅提升运行效率。