arXiv ID:
2604.21806
arXiv 提交日期: 2026-04-23
TEMA:锚定图像、跟随文本的多模态图像检索方法 / TEMA: Anchor the Image, Follow the Text for Multi-Modification Composed Image Retrieval
1️⃣ 一句话总结
这篇论文提出了一种名为TEMA的新型图像检索框架,专门解决现有方法在用户同时提出多个修改要求时表现不佳的问题,并通过构建两个多修改数据集和一种高效的文本-图像匹配架构,在保持检索精度的同时大幅提升了处理复杂多模态查询的能力。