arXiv ID:
2603.03680
arXiv 提交日期: 2026-03-04
MAGE:面向语言智能体的元强化学习框架,用于策略性探索与利用 / MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation
1️⃣ 一句话总结
这篇论文提出了一个名为MAGE的元强化学习框架,它能让大型语言模型智能体通过多轮训练和反思,学会在动态环境中进行策略性的探索和利用,从而在单人和多智能体任务中都表现得更好,并能适应未见过的对手。