arXiv ID:
2512.12799
arXiv 提交日期: 2025-12-14
DrivePI:用于自动驾驶统一理解、感知、预测与规划的空间感知4D多模态大语言模型 / DrivePI: Spatial-aware 4D MLLM for Unified Autonomous Driving Understanding, Perception, Prediction and Planning
1️⃣ 一句话总结
本文提出了一种名为DrivePI的新型空间感知多模态大模型,它能够在一个统一的框架内,同时处理自动驾驶中的环境理解、三维物体感知、未来轨迹预测和驾驶规划任务,并且性能超越了现有的大型模型和专门模型。