arXiv ID:
2604.24602
arXiv 提交日期: 2026-04-27
主导化引导的视觉-语言模型测试时自适应方法:应对模态特异性偏移 / Majorization-Guided Test-Time Adaptation for Vision-Language Models under Modality-Specific Shift
1️⃣ 一句话总结
本文提出了一种针对视觉-语言模型在部署时出现视觉与文本分支不对称偏移问题的测试时自适应方法,通过引入模态可靠性约束来避免传统熵最小化方法因不可靠模态主导而导致错误增加,在保持模型骨干不变的情况下仅更新轻量级门控或适配器,显著提升了多模态偏移场景下的分类准确率。