arXiv ID:
2601.04720
arXiv 提交日期: 2026-01-08
Qwen3-VL-Embedding与Qwen3-VL-Reranker:一个用于最先进多模态检索与排序的统一框架 / Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking
1️⃣ 一句话总结
这篇论文推出了一个由两个核心模型组成的统一框架,能够将文本、图像、文档图片和视频等多种信息映射到同一个语义空间,并通过先检索后精排的流程,实现高精度的跨模态搜索,在多项评测中达到了领先水平。