arXiv ID:
2604.17941
arXiv 提交日期: 2026-04-20
从注意力头到神经元:多任务视觉语言模型中的因果归因与调控 / From Heads to Neurons: Causal Attribution and Steering in Multi-Task Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为HONES的新方法,它通过分析模型内部注意力头与神经元之间的关联,来更准确地找出并调控那些对完成不同视觉语言任务至关重要的神经元,从而提升模型在多任务场景下的性能和可解释性。