arXiv ID:
2606.29541
arXiv 提交日期: 2026-06-28
合作多智能体强化学习中的习得协调惯例:衡量理论指导角色与学习到的路由之间的翻译差距 / Learned Coordination Conventions in Cooperative MARL: Measuring the Translation Gap Between Theory-Informed Roles and Learned Routing
1️⃣ 一句话总结
本文通过引入角色路由矩阵和敏感性分析等工具,系统性地衡量了合作多智能体系统中理论设计的角色分配与实际学习到的协调模式之间的差距,发现基于标签的注意力机制比传统方法更能稳定地形成与设计预期相匹配的协作结构,并能在不同团队规模下实现零样本迁移。