arXiv ID:
2604.15308
arXiv 提交日期: 2026-04-16
RAD-2:在生成器-判别器框架中扩展强化学习 / RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework
1️⃣ 一句话总结
这篇论文提出了一种名为RAD-2的新型自动驾驶规划框架,它结合了扩散模型来生成多种可能的行驶轨迹,并用强化学习优化的判别器来挑选出长期驾驶质量最好的轨迹,从而在保持多样性的同时显著提升了驾驶的安全性和稳定性。