arXiv ID:
2603.14948
桥接场景生成与规划:通过统一视觉与运动表征实现基于世界模型的驾驶 / Bridging Scene Generation and Planning: Driving with World Model via Unifying Vision and Motion Representation
1️⃣ 一句话总结
这篇论文提出了一个名为WorldDrive的自动驾驶框架,它通过统一视觉和运动表征,将预测未来场景的生成模型与实时运动规划紧密结合,从而在保证高质量视频生成的同时,实现了领先的纯视觉规划性能。