arXiv ID:
2603.05280
arXiv 提交日期: 2026-03-05
逐层逐模块:为ViT模型选择最优的分布外探测策略 / Layer by layer, module by module: Choose both for optimal OOD probing of ViT
1️⃣ 一句话总结
这篇论文研究发现,当视觉Transformer模型遇到与训练数据差异较大的新任务时,在模型中间层的特定模块(如前馈网络内部)进行特征提取,比在最终输出层或整个Transformer块输出处提取特征能获得更好的性能。