arXiv ID:
2603.15418
arXiv 提交日期: 2026-03-16
MA-VLCM:一种用于多智能体团队场景中策略价值评估的视觉语言批评模型 / MA-VLCM: A Vision Language Critic Model for Value Estimation of Policies in Multi-Agent Team Settings
1️⃣ 一句话总结
这篇论文提出了一种新方法,利用预训练好的视觉语言大模型来快速评估多机器人团队的合作表现,从而大幅减少了训练所需的数据量,并能让训练好的策略直接部署在计算资源有限的真实机器人上。