arXiv ID:
2603.16060
ARISE:分层强化学习中基于内在技能演化的智能体推理 / ARISE: Agent Reasoning with Intrinsic Skill Evolution in Hierarchical Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个名为ARISE的分层强化学习框架,它通过让智能体在训练中自动总结和复用成功的解题策略(技能),来持续提升大语言模型的数学推理能力,尤其在处理未见过的难题时效果显著。