arXiv ID:
2603.02862
arXiv 提交日期: 2026-03-03
具有外生动态的马尔可夫决策过程学习 / Learning in Markov Decision Processes with Exogenous Dynamics
1️⃣ 一句话总结
这篇论文提出了一种针对特定结构(部分状态变量不受智能体控制而独立演化)的强化学习方法,通过利用这种结构显著提升了学习效率,并在理论和实验中验证了其优越性。