arXiv ID:
2605.01778
arXiv 提交日期: 2026-05-03
基于通用函数逼近的对抗式模仿学习:理论分析与实用算法 / Adversarial Imitation Learning with General Function Approximation: Theoretical Analysis and Practical Algorithms
1️⃣ 一句话总结
本文提出一种名为OPT-AIL的对抗式模仿学习新框架,通过将奖励学习与策略学习分别进行在线优化和乐观正则化优化,首次在通用函数逼近条件下实现了理论上的高效性,并且方法简单、易于实现,实验表明其性能优于现有深度学习模仿学习方法。