arXiv ID:
2605.20772
基于视觉干预的医学视觉问答幻觉检测方法 / VIHD: Visual Intervention-based Hallucination Detection for Medical Visual Question Answering
1️⃣ 一句话总结
针对医学多模态大模型在视觉问答中可能生成缺乏视觉证据的幻觉回答的问题,本文提出了一种名为VIHD的新方法,通过精准定位并遮蔽关键视觉区域来校准模型的语义不确定性,从而更可靠地检测出文本合理但视觉无据的幻觉结果,并在多个医学数据集上验证了其有效性。