arXiv ID:
2606.02242
解决图像与文本行人重识别之间的优化冲突 / Towards Resolving Optimization Conflicts Between Image- and Text-Based Person Re-Identification
1️⃣ 一句话总结
本文发现图像行人重识别和文本行人重识别在联合训练时存在目标冲突,导致共享表征效果不佳,为此提出了一种分阶段训练方法——先用图像任务预训练视觉编码器,再融入文本监督,从而在不干扰彼此的情况下提升两种任务的表现。