arXiv ID:
2512.13399
arXiv 提交日期: 2025-12-15
可微分进化强化学习 / Differentiable Evolutionary Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为DERL的新方法,它能够像训练智能体一样,自动学习和优化奖励函数本身,从而让AI在复杂的推理任务中更高效地学会如何给自己设定更好的目标。