arXiv ID:
2604.11095
arXiv 提交日期: 2026-04-13
瓶颈令牌:用于统一多模态检索 / Bottleneck Tokens for Unified Multimodal Retrieval
1️⃣ 一句话总结
这篇论文提出了一种名为‘瓶颈令牌’的新方法,通过引入一组可学习的令牌作为显式信息聚合器,并配合一种新的训练目标,有效解决了多模态大语言模型在统一检索任务中信息压缩和聚合的难题,从而在多个模态和任务上取得了领先的检索性能。