🤖 系统
11-30 17:29
📄 论文总结
通过对比注意力聚焦:增强视觉语言模型的视觉推理能力 / Focusing by Contrastive Attention: Enhancing VLMs' Visual Reasoning
1️⃣ 一句话总结
这项研究提出了一种无需额外训练的方法CARVE,通过对比视觉语言模型中通用查询和任务特定查询的注意力差异,有效分离图像中的语义信号和视觉噪声,从而在复杂视觉场景下显著提升模型的推理性能。