arXiv ID:
2603.04833
arXiv 提交日期: 2026-03-05
SCoUT:多智能体强化学习中基于效用引导时序分组的可扩展通信 / SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个名为SCoUT的新方法,通过动态、软性地将智能体分组并利用反事实推理来精准分配通信功劳,从而让多智能体系统在学习何时、与谁通信时更高效、更可扩展,同时保持去中心化执行的优点。