arXiv ID:
2603.05066
arXiv 提交日期: 2026-03-05
奖励条件化强化学习 / Reward-Conditioned Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为‘奖励条件化强化学习’的新方法,它能让一个智能体学会应对多种不同的任务目标,而不仅仅局限于训练时设定的单一奖励标准,从而提高了智能体的适应性和鲁棒性。