arXiv ID:
2603.24058
arXiv 提交日期: 2026-03-25
通过注意力失衡矫正缓解大型视觉语言模型中的物体幻觉问题 / Mitigating Object Hallucinations in LVLMs via Attention Imbalance Rectification
1️⃣ 一句话总结
这篇论文发现大型视觉语言模型产生‘物体幻觉’(即描述图片中不存在的物体)的根本原因是模型注意力分配失衡,并据此提出了一种轻量级的解码时干预方法,通过重新分配注意力权重来有效减少幻觉,同时还能提升模型在其他视觉语言任务上的综合表现。