arXiv ID:
2604.21360
arXiv 提交日期: 2026-04-23
基于原型的视觉-语言模型测试时自适应方法 / Prototype-Based Test-Time Adaptation of Vision-Language Models
1️⃣ 一句话总结
为了克服现有测试时自适应方法(如缓存方法)在速度和准确性上的不足,本文提出了一种基于类知识原型的全新方法,它通过动态加权融合每个测试样本的特征来累积知识,无需缓存和检索,从而在保持极高推理速度的同时,在15个图像识别和4个点云分析任务上取得了最优性能。