arXiv ID:
2602.01639
arXiv 提交日期: 2026-02-02
ReCALL:针对基于MLLM的组合图像检索的能力退化再校准 / ReCALL: Recalibrating Capability Degradation for MLLM-based Composed Image Retrieval
1️⃣ 一句话总结
这篇论文提出了一个名为ReCALL的通用框架,通过诊断、生成和精炼三个步骤,解决了将生成式多模态大语言模型直接用于图像检索任务时,其原有的精细推理能力会下降的问题,从而显著提升了组合图像检索的性能。