🤖 系统
11-30 17:40
📄 论文总结
OmniVideoBench:面向全能多模态大语言模型的视听理解评估 / OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs
1️⃣ 一句话总结
这篇论文提出了一个名为OmniVideoBench的大规模评估基准,专门用于全面测试多模态大语言模型在视频中结合声音和画面进行协同推理的能力,发现现有模型与人类水平仍有较大差距。