arXiv ID:
2605.13054
arXiv 提交日期: 2026-05-13
弥合领域差距:面向离线强化学习的对齐目标生成方法 / Bridging Domain Gaps with Target-Aligned Generation for Offline Reinforcement Learning
1️⃣ 一句话总结
本论文提出了一种名为TCE的框架,通过理论指导下的目标对齐生成技术,在目标域数据极其有限的情况下,智能地利用源域数据来扩展状态覆盖范围,从而有效解决了跨领域离线强化学习中因环境差异导致的策略适配难题。