arXiv ID:
2603.09827
MA-EgoQA:基于多智能体第一视角视频的问答 / MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents
1️⃣ 一句话总结
这篇论文提出了一个名为MA-EgoQA的新基准测试和数据集,用于评估人工智能模型如何同时理解和回答基于多个智能体第一视角视频的问题,并发现现有模型在这方面存在显著不足,从而为未来多智能体协作系统的开发指明了方向。