arXiv ID:
2603.09771
arXiv 提交日期: 2026-03-10
Ego:基于嵌入引导的视觉语言模型个性化方法 / Ego: Embedding-Guided Personalization of Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一种高效的方法,让通用视觉语言模型能记住并识别特定的人或物体,无需额外训练,只需利用模型内部的注意力机制提取关键视觉特征作为‘记忆’,就能在后续任务中快速实现个性化识别和描述。