arXiv ID:
2602.19449
arXiv 提交日期: 2026-02-23
解耦视觉与语言:基于码本锚定的视觉适配 / Decoupling Vision and Language: Codebook Anchored Visual Adaptation
1️⃣ 一句话总结
这篇论文提出了一种名为CRAFT的轻量级方法,通过使用一个离散码本将视觉表示锚定在稳定的符号空间中,从而让大型视觉语言模型在不修改其他部分的情况下,高效地适应医学图像诊断等特定领域任务,并显著提升其性能。