arXiv ID:
2606.24947
arXiv 提交日期: 2026-06-23
面向分布式能源协调的监督式强化学习 / Supervised Reinforcement Learning for the Coordination of Distributed Energy Resources
1️⃣ 一句话总结
受大语言模型训练方式的启发,本文提出一种“先模仿、后优化”的监督式强化学习框架,先利用现有数据让模型学会基本协调策略,再通过离线与在线两个阶段的精细调优来适应真实环境,从而高效、可靠地管理分布式能源,即使训练数据质量不高也能取得优秀效果。