arXiv ID:
2512.21337
arXiv 提交日期: 2025-12-24
超越记忆:一个多模态序数回归基准,用于揭示视觉-语言模型中的流行度偏见 / Beyond Memorization: A Multi-Modal Ordinal Regression Benchmark to Expose Popularity Bias in Vision-Language Models
1️⃣ 一句话总结
这篇论文通过构建一个包含5.5万多张建筑图像的大型数据集,发现当前先进的视觉-语言模型存在严重的流行度偏见,即对知名建筑的识别准确率远高于普通建筑,揭示了模型过度依赖记忆而非真正理解能力的缺陷。