arXiv ID:
2512.10863
MMSI-Video-Bench:一个用于视频空间智能的整体性基准测试集 / MMSI-Video-Bench: A Holistic Benchmark for Video-Based Spatial Intelligence
1️⃣ 一句话总结
这篇论文提出了一个名为MMSI-Video-Bench的全面基准测试集,用于评估多模态大语言模型在理解视频中三维空间信息的能力,测试发现当前最先进的模型与人类水平相比仍有巨大差距。