arXiv ID:
2603.23447
arXiv 提交日期: 2026-03-24
3DCity-LLM:赋能多模态大语言模型进行三维城市级感知与理解 / 3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding
1️⃣ 一句话总结
这篇论文提出了一个名为3DCity-LLM的新框架,它通过一种从粗到细的特征编码方法和一个大规模高质量数据集,成功地将多模态大语言模型的能力扩展到了三维城市级场景的理解与规划任务上,显著超越了现有方法。