arXiv ID:
2603.08063
arXiv 提交日期: 2026-03-09
通过大型视觉-语言模型驱动的关系建模增强跨视角无人机地理定位 / Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling
1️⃣ 一句话总结
这篇论文提出了一种利用大型视觉-语言模型来学习无人机与卫星图像之间深层关联的新方法,通过一个即插即用的关系建模模块和新型损失函数,显著提升了跨视角图像匹配的准确性和稳定性。