arXiv ID:
2605.02777
arXiv 提交日期: 2026-05-04
一种适应变化成本限制的解耦扩散规划器:基于成本条件生成保障安全与奖励梯度提升性能 / A decoupled diffusion planner that adapts to changing cost limits by using cost-conditioned generation for safety and reward gradients for performance
1️⃣ 一句话总结
本文提出了一种名为SDGD的智能规划方法,它通过将安全成本限制作为生成条件来确保轨迹始终满足安全要求,同时利用奖励梯度引导优化性能,解决了传统方法中安全与性能相互冲突的难题,在多数测试任务中既严格遵从安全约束又取得了最高奖励。