arXiv ID:
2511.15705
arXiv 提交日期: 2025-11-19
GeoVista:用于地理定位的增强网络代理视觉推理 / GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization
1️⃣ 一句话总结
这篇论文提出了GeoVista模型和GeoBench基准,通过结合图像放大和网络搜索工具,训练智能代理更准确地根据图片推断地理位置,性能接近顶尖闭源模型。