arXiv ID:
2606.22807
arXiv 提交日期: 2026-06-22
KaLM-Reranker-V1:快速但不晚交互的压缩文档重排序 / KaLM-Reranker-V1: Fast but Not Late Interaction for Compressed Document Reranking
1️⃣ 一句话总结
本文提出了一种名为KaLM-Reranker-V1的新型文档重排序模型,通过将查询和文档的计算过程分离(编码器预编码文档,解码器处理查询意图),再使用交叉注意力机制捕捉相关性,从而在保持高效推理速度的同时,实现了与顶尖模型相当的重排序性能,并且小模型也能达到大型嵌入模型的效果。