arXiv ID:
2602.14577
DriveFine:用于精确鲁棒驾驶的增强掩码扩散视觉语言动作模型 / DriveFine: Refining-Augmented Masked Diffusion VLA for Precise and Robust Driving
1️⃣ 一句话总结
这篇论文提出了一种名为DriveFine的新型自动驾驶规划模型,它巧妙地将扩散模型和基于令牌的模型的优势结合起来,通过一个创新的模块化专家设计,在生成驾驶动作的同时具备自我修正能力,从而在多个基准测试中实现了更精确、更鲁棒的驾驶性能。