arXiv ID:
2509.02547
arXiv 提交日期: 2025-09-02
面向大语言模型的智能体强化学习研究全景:一项综述 / The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
1️⃣ 一句话总结
这篇综述系统梳理了将大语言模型从被动文本生成器转变为能在复杂环境中自主决策的智能体的强化学习方法,提出了基于核心能力和应用领域的双重分类体系,并整合了相关开源资源以推动未来研究。