OpenREAD:基于LLM作为评判者的强化开放式推理端到端自动驾驶 / OpenREAD: Reinforced Open-Ended Reasoning for End-to-End Autonomous Driving with LLM-as-Critic
1️⃣ 一句话总结
这篇论文提出了一个名为OpenREAD的端到端自动驾驶框架,它通过使用大型语言模型作为评判者来量化开放式问题的推理质量,并利用强化学习对整个系统进行联合优化,从而在推理和规划任务上取得了领先的性能。
请先 登录 后再提交论文
OpenREAD:基于LLM作为评判者的强化开放式推理端到端自动驾驶 / OpenREAD: Reinforced Open-Ended Reasoning for End-to-End Autonomous Driving with LLM-as-Critic
这篇论文提出了一个名为OpenREAD的端到端自动驾驶框架,它通过使用大型语言模型作为评判者来量化开放式问题的推理质量,并利用强化学习对整个系统进行联合优化,从而在推理和规划任务上取得了领先的性能。
SimScale:通过大规模真实世界仿真学习驾驶 / SimScale: Learning to Drive via Real-World Simulation at Scale
这篇论文提出了一个名为SimScale的新型仿真框架,它能够利用现有的真实驾驶数据,通过神经渲染和反应式环境生成大量高保真、多样化的模拟驾驶场景,并配合一种伪专家轨迹生成机制来提供训练监督,从而显著提升自动驾驶规划模型在安全关键和罕见场景下的鲁棒性与泛化能力,且其性能提升仅需增加模拟数据即可平滑扩展。
MiMo-Embodied:跨具身基础模型技术报告 / MiMo-Embodied: X-Embodied Foundation Model Technical Report
这篇论文开源了首个跨具身基础模型MiMo-Embodied,它通过多阶段学习和优化训练方法,在自动驾驶和具身AI两大领域同时实现了顶尖性能,并证明了这两个领域能够相互促进和提升。
用于自动驾驶中反射式视觉-语言-动作模型的离散扩散方法 / Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving
这篇论文提出了一种名为ReflectDrive的新型自动驾驶框架,它通过离散扩散和无需梯度计算的安全反射机制,实现了更安全、可扩展的轨迹生成,克服了现有方法依赖复杂规则或模拟环境的局限性。