arXiv ID:
2512.16848
arXiv 提交日期: 2025-12-18
元强化学习引导语言智能体进行探索 / Meta-RL Induces Exploration in Language Agents
1️⃣ 一句话总结
这篇论文提出了一个名为LaMer的元强化学习框架,它能让大型语言模型智能体在执行任务时更主动地探索环境并从反馈中学习,从而在多种复杂任务上取得比传统强化学习方法更好的性能和更强的适应能力。