arXiv ID:
2604.07914
arXiv 提交日期: 2026-04-09
缓解大型视觉语言模型中的纠缠引导以降低幻觉 / Mitigating Entangled Steering in Large Vision-Language Models for Hallucination Reduction
1️⃣ 一句话总结
本文提出了一种名为MESA的即插即用框架,通过有选择性地干预模型内部信号来减少AI看图说话时产生的‘幻觉’(即文本与图像内容不符),同时避免了现有方法导致的输出变短或语言风格改变等问题。