arXiv ID:
2602.03677
arXiv 提交日期: 2026-02-03
指令锚点:剖析多模态仲裁的因果动态机制 / Instruction Anchors: Dissecting the Causal Dynamics of Modality Arbitration
1️⃣ 一句话总结
这篇论文揭示了多模态大语言模型如何根据用户指令选择性地利用图像或文本信息的内在机制,发现少数关键的注意力头主导了这一决策过程,并且通过微小的干预就能显著改变模型的行为。