arXiv ID:
2606.24160
arXiv 提交日期: 2026-06-23
因果强化学习导论 / An Introduction to Causal Reinforcement Learning
1️⃣ 一句话总结
本文提出了一种将因果推断与强化学习统一起来的新框架,通过将环境分解为具有因果不变性的自主机制,揭示了在线学习、离线学习和因果推理三种模式的内在联系,并以此为基础定义了广义策略学习、模仿学习和反事实学习等新任务,从而开创了因果强化学习这一交叉研究方向。