arXiv ID:
2604.05623
DetailVerifyBench:长图像描述中密集幻觉定位的基准 / DetailVerifyBench: A Benchmark for Dense Hallucination Localization in Long Image Captions
1️⃣ 一句话总结
这篇论文提出了一个名为DetailVerifyBench的新基准测试,专门用于评估AI模型在长达数百字的详细图像描述中,精准找出并定位具体错误词语或片段的能力,以解决当前多模态大模型生成长描述时内容不可靠的难题。