arXiv ID:
2603.10895
arXiv 提交日期: 2026-03-11
强化学习中的遍历性 / Ergodicity in reinforcement learning
1️⃣ 一句话总结
这篇论文指出,当强化学习中的奖励过程不具备遍历性时,传统的期望值优化目标无法保证单个智能体的长期表现,并探讨了解决这一问题的现有方法。