arXiv ID:
2602.16105
arXiv 提交日期: 2026-02-18
GPSBench:大型语言模型理解GPS坐标吗? / GPSBench: Do Large Language Models Understand GPS Coordinates?
1️⃣ 一句话总结
这篇论文通过发布一个包含5.78万个样本的GPSBench数据集来评估大型语言模型的地理空间推理能力,发现模型在真实世界地理知识上表现尚可,但在精确的几何坐标计算上仍有很大挑战,并且通过微调可以在某些任务上提升,但会牺牲部分世界知识。