arXiv ID:
2604.12630
arXiv 提交日期: 2026-04-14
GeoAlign:用于多模态大语言模型空间推理的几何特征重对齐 / GeoAlign: Geometric Feature Realignment for MLLM Spatial Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为GeoAlign的新框架,通过动态聚合3D模型的多层几何特征并与视觉内容对齐,有效解决了现有多模态大模型在空间推理任务上的不足,使小型模型也能达到顶尖性能。