arXiv ID:
2604.00722
arXiv 提交日期: 2026-04-01
LangMARL:自然语言多智能体强化学习 / LangMARL: Natural Language Multi-Agent Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个名为LangMARL的新框架,它通过将经典多智能体强化学习中的信用分配和策略梯度进化思想引入到语言模型中,解决了大语言模型智能体在动态环境中难以自主进化协作策略的问题,从而提升了学习效率、可解释性和泛化能力。