arXiv ID:
2601.03227
arXiv 提交日期: 2026-01-06
声纳时刻:在音频地理定位任务中评估音频-语言模型 / The Sonar Moment: Benchmarking Audio-Language Models in Audio Geo-Localization
1️⃣ 一句话总结
这篇论文提出了首个用于评估音频-语言模型地理定位能力的基准数据集AGL1K,发现闭源模型表现远超开源模型,且模型主要依赖语言线索而非纯音频特征进行地理位置推断。