arXiv ID:
2603.03068
arXiv 提交日期: 2026-03-03
基于符号奖励机的强化学习 / Reinforcement Learning with Symbolic Reward Machines
1️⃣ 一句话总结
这篇论文提出了一种名为‘符号奖励机’的新方法,它能自动理解强化学习任务的目标,无需人工预先设定规则,在保持高性能的同时让任务目标对用户更透明易懂。