arXiv ID:
2605.28544
arXiv 提交日期: 2026-05-27
DriveWAM:视频生成先验知识实现可扩展的自动驾驶世界-动作联合建模 / DriveWAM: Video Generative Priors Enable Scalable World-Action Modeling for Autonomous Driving
1️⃣ 一句话总结
本文提出DriveWAM模型,通过将预训练视频生成模型改造为能同时生成视频和驾驶动作的自回归策略,并引入场景理解和高效记忆机制,在自动驾驶规划任务中实现了数据量越大性能越好的可扩展效果。