arXiv ID:
2510.09008
arXiv 提交日期: 2025-10-10
关于大视觉语言模型中物体幻觉的视觉标记认知不确定性研究 / On Epistemic Uncertainty of Visual Tokens for Object Hallucinations in Large Vision-Language Models
1️⃣ 一句话总结
这项研究发现大视觉语言模型产生物体幻觉的关键原因是视觉编码器中存在高不确定性的视觉标记,并提出了一种通过识别并屏蔽这些不确定标记来有效减少幻觉的简单方法。