arXiv ID:
2605.10177
MTA-RL:基于多模态Transformer的三维可通行空间与强化学习的鲁棒城市自动驾驶 / MTA-RL: Robust Urban Driving via Multi-modal Transformer-based 3D Affordances and Reinforcement Learning
1️⃣ 一句话总结
本文提出了一种名为MTA-RL的新框架,通过结合多模态Transformer和强化学习,将摄像头图像和激光雷达数据融合成易于理解的3D可通行空间信息,从而使自动驾驶决策更稳定、更高效,并在模拟环境中展现出远超现有方法的事故率降低和跨场景泛化能力。