arXiv ID:
2603.22934
arXiv 提交日期: 2026-03-24
ProGRank:通过探针梯度重排序防御密集检索器RAG的语料库投毒攻击 / ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning
1️⃣ 一句话总结
这篇论文提出了一种名为ProGRank的新方法,它无需额外训练,通过分析检索模型在轻微扰动下的梯度稳定性来识别并过滤掉被恶意篡改的文本,从而有效保护基于检索增强生成(RAG)的系统免受语料库投毒攻击,同时保持了良好的检索效果。