arXiv ID:
2606.22579
arXiv 提交日期: 2026-06-21
模型失配下的平稳鲁棒平均场博弈 / Stationary Robust Mean-Field Games under Model Mismatches
1️⃣ 一句话总结
本文提出了一种针对多智能体强化学习中训练环境与真实环境不一致(模型失配)问题的鲁棒平均场博弈框架,通过引入分布鲁棒性并建立带压缩Bellman算子的动态规划原理,证明了平稳鲁棒均衡的存在性,开发了首个具有收敛保证的算法,并证明了该均衡可在大规模智能体系统中提供近似最优的鲁棒策略。