arXiv ID:
2605.21479
arXiv 提交日期: 2026-05-20
WikiVQABench:基于维基百科和维基数据的知识驱动视觉问答基准 / WikiVQABench: A Knowledge-Grounded Visual Question Answering Benchmark from Wikipedia and Wikidata
1️⃣ 一句话总结
本文提出了一个名为WikiVQABench的视觉问答基准数据集,它通过结合维基百科图片、文字说明和维基百科的结构化知识,精心设计了需要外部常识才能回答的题目,用来检验AI模型在理解图片时能否运用背景知识进行推理,而不仅仅是识别图像内容。