arXiv ID:
2602.05776
arXiv 提交日期: 2026-02-05
通过选择性转移修正实现跨领域离线策略适应 / Cross-Domain Offline Policy Adaptation via Selective Transition Correction
1️⃣ 一句话总结
这篇论文提出了一种名为‘选择性转移修正’的新算法,它通过智能地修正和筛选来自相似但动态特性不同的源领域数据,让智能体能够更安全、有效地利用这些数据来提升在目标领域的离线强化学习性能。