arXiv ID:
2603.01441
arXiv 提交日期: 2026-03-02
面向自动驾驶的语言-动作理解与生成的统一模型 / Unifying Language-Action Understanding and Generation for Autonomous Driving
1️⃣ 一句话总结
这篇论文提出了一种名为LinkVLA的新架构,通过统一语言与动作的表示并引入双向训练目标,解决了自动驾驶中指令与动作不对齐以及动作生成效率低下的问题,从而显著提升了驾驶性能并大幅减少了推理时间。