arXiv最新AI论文速览速学

🔍

标签: #reranking ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: KaLM-Reranker-V1: Fast but Not Late Interaction for Compressed Document Reranking 06-23

arXiv ID: 2606.22807

arXiv 提交日期: 2026-06-22

systems model training model evaluation reranking encoder-decoder efficiency matryoshka embedding benchmark

KaLM-Reranker-V1：快速但不晚交互的压缩文档重排序 / KaLM-Reranker-V1: Fast but Not Late Interaction for Compressed Document Reranking

1️⃣ 一句话总结

本文提出了一种名为KaLM-Reranker-V1的新型文档重排序模型，通过将查询和文档的计算过程分离（编码器预编码文档，解码器处理查询意图），再使用交叉注意力机制捕捉相关性，从而在保持高效推理速度的同时，实现了与顶尖模型相当的重排序性能，并且小模型也能达到大型嵌入模型的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20818

arXiv 提交日期: 2026-05-20

computer vision multi-modal egocentric video temporal localization video-language reasoning reranking ego4d challenge

OSGNet结合多模态大语言模型重排序：Ego4D情景记忆挑战2026解决方案 / OSGNet with MLLM Reranking @ Ego4D Episodic Memory Challenge 2026

1️⃣ 一句话总结

本文提出了一种结合传统定位模型OSGNet和多模态大语言模型（MLLM）的两阶段框架，先快速生成候选视频片段，再让MLLM从中选出最匹配自然语言查询的目标片段，从而在无需大量计算的前提下显著提升第一人称长视频中事件定位的准确性，并在两项国际竞赛中夺得第一。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.04615

arXiv 提交日期: 2026-05-06

machine learning benchmark natural language processing code search reranking contamination text-to-code code-to-code

超越检索：面向代码搜索的多任务基准与模型 / Beyond Retrieval: A Multitask Benchmark and Model for Code Search

1️⃣ 一句话总结

本文提出了一个名为CoREB的多任务基准测试和微调的重排序模型，用于解决现有代码搜索基准存在的数据污染和标签噪声问题，实验表明该模型能在文本到代码、代码到文本和代码到代码三个任务上首次实现一致性的性能提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20199

arXiv 提交日期: 2026-04-22

llm natural language processing multi-modal multilingual rag language bias reranking bias mitigation cross-lingual retrieval

所有语言都重要：理解并缓解多语言RAG中的语言偏见 / All Languages Matter: Understanding and Mitigating Language Bias in Multilingual RAG

1️⃣ 一句话总结

本文揭示了多语言检索增强生成（mRAG）系统中，重排序阶段存在偏向英语和查询语言的系统性偏见，导致跨语言的有用证据被压制，并提出了一种名为LAURA的新方法，通过让重排序器直接对齐下游生成效果，有效消除了这种语言偏见，显著提升了多语言问答的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.22934

arXiv 提交日期: 2026-03-24

llm systems model evaluation retrieval-augmented generation corpus poisoning adversarial defense dense retriever reranking

ProGRank：通过探针梯度重排序防御密集检索器RAG的语料库投毒攻击 / ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning

1️⃣ 一句话总结

这篇论文提出了一种名为ProGRank的新方法，它无需额外训练，通过分析检索模型在轻微扰动下的梯度稳定性来识别并过滤掉被恶意篡改的文本，从而有效保护基于检索增强生成（RAG）的系统免受语料库投毒攻击，同时保持了良好的检索效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17532

arXiv 提交日期: 2026-01-24

llm natural language processing model evaluation retrieval-augmented generation evidence selection reranking information gain question answering

检索增强生成中的“少即是多”：基于信息增益剪枝的生成器对齐重排序与证据选择 / Less is More for RAG: Information Gain Pruning for Generator-Aligned Reranking and Evidence Selection

1️⃣ 一句话总结

这篇论文提出了一种名为‘信息增益剪枝’的新方法，它能在不改变现有系统接口的前提下，智能地筛选出对生成答案真正有用的检索文本，从而在显著减少输入信息量的同时，大幅提升问答系统的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.01617

arXiv 提交日期: 2025-11-03

multi-modal natural language processing computer vision video retrieval rank fusion zero-shot reasoning vision-language models reranking

上下文投票：将视觉语言模型转化为零样本排序融合器 / Vote-in-Context: Turning VLMs into Zero-Shot Rank Fusers

1️⃣ 一句话总结

这项研究提出了一种无需训练的通用框架，通过将检索结果的内容和元数据整合到视觉语言模型的提示中，使其能够像人类一样进行推理，从而在零样本条件下显著提升跨模态视频检索的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22807

1️⃣ 一句话总结

arXiv ID: 2605.20818

1️⃣ 一句话总结

arXiv ID: 2605.04615

1️⃣ 一句话总结

arXiv ID: 2604.20199

1️⃣ 一句话总结

arXiv ID: 2603.22934

1️⃣ 一句话总结

arXiv ID: 2601.17532

1️⃣ 一句话总结

arXiv ID: 2511.01617

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22807 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20818 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.04615 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20199 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.22934 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17532 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.01617 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22807

arXiv ID: 2605.20818

arXiv ID: 2605.04615

arXiv ID: 2604.20199

arXiv ID: 2603.22934

arXiv ID: 2601.17532

arXiv ID: 2511.01617