arXiv ID:
2606.03521
arXiv 提交日期: 2026-06-02
基于模型的强化学习的事后鲁棒性方法 / Post-Hoc Robustness for Model-Based Reinforcement Learning
1️⃣ 一句话总结
本文提出了一种在强化学习模型推断阶段事后提升鲁棒性的方法,通过利用已学习的模型和标称策略,在对抗性扰动下进行模型预测控制,无需额外训练神经网络,即可显著增强算法在环境扰动下的表现。