arXiv ID:
2606.24991
arXiv 提交日期: 2026-06-23
利用模型预测控制求解包含未来信息的马尔可夫决策过程 / Solving Markov Decision Processes with Future Information via MPC
1️⃣ 一句话总结
本文研究了如何在传统模型预测控制中融入未来信息(如预测数据或参考轨迹),并证明了在特定条件下,参数化的MPC可以精确表示最优价值函数和策略,从而通过强化学习学习这些参数,解决实际决策问题中的状态空间扩展挑战。