arXiv ID:
2603.28026
arXiv 提交日期: 2026-03-30
当选项成为先验:用于科学图表多选题问答的对比解码方法 / When Choices Become Priors: Contrastive Decoding for Scientific Figure Multiple-Choice QA
1️⃣ 一句话总结
这篇论文发现,在科学图表多选题中,答案选项本身会成为一种干扰性的‘先验知识’,导致多模态模型忽略图像证据而选择看似合理的答案,为此作者提出了一种无需训练的‘SCICON’解码方法,通过对比模型在有图和无图时对选项的打分差异,来迫使模型更依赖图像进行推理,从而在多个基准测试中有效提升了答题准确率。