arXiv ID:
2511.09809
arXiv 提交日期: 2025-11-12
测试时频谱感知的潜在空间导向:实现视觉语言模型的零样本泛化 / Test-Time Spectrum-Aware Latent Steering for Zero-Shot Generalization in Vision-Language Models
1️⃣ 一句话总结
这项研究提出了一种无需修改核心模型或反向传播的轻量级方法,通过在测试时分析文本特征的频谱模式并微调少量参数来提升视觉语言模型在未知数据上的表现,同时大幅提高了推理速度和内存效率。