arXiv ID:
2605.18621
arXiv 提交日期: 2026-05-18
CrossView Suite:通过数据集、模型与基准测试释放多模态大语言模型的跨视角空间智能 / CrossView Suite: Harnessing Cross-view Spatial Intelligence of MLLMs with Dataset, Model and Benchmark
1️⃣ 一句话总结
这篇论文提出了一个名为CrossView Suite的综合框架,包含大规模跨视角数据集、系统化评测基准和一个从感知到对齐再到推理的三阶段模型,旨在帮助多模态大语言模型突破单视角局限,实现多视角下物体一致性理解与空间推理。