arXiv ID:
2603.05113
arXiv 提交日期: 2026-03-05
解耦任务与行为:机器人强化学习中的两阶段奖励课程 / Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics
1️⃣ 一句话总结
这篇论文提出了一种两阶段训练方法,先让机器人学会基本任务,再引导它优化行为细节(如节能),从而更简单有效地训练出性能更好、更稳定的机器人控制策略。