arXiv ID:
2604.00455
arXiv 提交日期: 2026-04-01
首词对数增强:缓解大型视觉语言模型中物体幻觉的视觉接地方法 / First Logit Boosting: Visual Grounding Method to Mitigate Object Hallucination in Large Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一种无需额外训练的简单方法,通过增强生成过程中首个词的重要性来持续利用视觉信息,从而有效减少AI模型在描述图片时凭空捏造物体的错误。