arXiv ID:
2603.02613
arXiv 提交日期: 2026-03-03
基于朗之万引导流匹配的自动驾驶实时生成策略 / Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving
1️⃣ 一句话总结
这篇论文提出了一种名为DACER-F的新强化学习算法,它通过结合流匹配技术和朗之万动力学,让自动驾驶系统在保持强大探索能力的同时,只需一步就能生成决策动作,从而实现了高性能与超低延迟的平衡。