arXiv ID:
2606.26498
arXiv 提交日期: 2026-06-25
平均场PhiBE:基于离散时间数据的连续时间平均场强化学习 / Mean-Field PhiBE: Continuous-Time Mean-Field Reinforcement Learning from Discrete-Time Data
1️⃣ 一句话总结
本文提出一种名为平均场PhiBE的算法框架,在仅能获取离散时间数据的情况下,通过将离散时间信息嵌入连续时间偏微分方程,成功实现了对连续时间平均场控制问题的无模型强化学习,并在理论上证明了其误差随时间步长线性减小,在线性二次情形下甚至能达到二阶精度。