arXiv ID:
2606.12365
环境扩散策略:从次优数据中学习机器人模仿 / Ambient Diffusion Policy: Imitation Learning from Suboptimal Data in Robotics
1️⃣ 一句话总结
本文提出一种名为“环境扩散策略”的简单且原则性强的机器人模仿学习方法,通过仅在扩散过程的高噪声和低噪声阶段利用次优数据,有效提取其中的有用特征而屏蔽有害干扰,从而显著提升了对低质量、任务不匹配等次优演示数据的利用效率,在多种真实场景下优于现有方法。