arXiv ID:
2604.01280
arXiv 提交日期: 2026-04-01
再看一眼:多模态大语言模型中无需训练的证据高亮方法 / Look Twice: Training-Free Evidence Highlighting in Multimodal Large Language Models
1️⃣ 一句话总结
这篇论文提出了一种名为‘Look Twice’的无需训练的方法,通过分析模型自身的注意力模式来识别并高亮图像和文本中的关键证据,从而显著提升了多模态大模型在回答知识密集型问题时的准确性和可靠性。