🤖 系统
11-30 17:38
📄 论文总结
SciVideoBench:大型多模态模型科学视频推理能力基准测试 / SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models
1️⃣ 一句话总结
这篇论文提出了一个专门用于评估大型多模态模型在科学视频中进行复杂推理能力的新基准测试,发现当前顶尖模型在这方面仍有明显不足,为未来AI助手在科学领域的应用提供了重要发展方向。