arXiv ID:
2512.16760
自动驾驶中的视觉-语言-动作模型:过去、现在与未来 / Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future
1️⃣ 一句话总结
这篇论文系统梳理了自动驾驶技术从传统模块化框架到新型视觉-语言-动作(VLA)模型的发展历程,指出VLA模型通过整合视觉感知、语言推理和动作生成,为实现更可解释、更通用且更符合人类意图的自动驾驶系统提供了新方向。