arXiv ID:
2605.28074
静默检索:通过语义保持的对抗性数据投毒劫持检索增强生成系统 / SilentRetrieval: Hijacking Retrieval-Augmented Generation via Semantically-Preserving Adversarial Data Poisoning
1️⃣ 一句话总结
这篇论文提出了一种名为SilentRetrieval的两阶段攻击方法,通过注入看似正常但精心设计的文档来劫持检索增强生成(RAG)系统,使模型在回答问题时被诱导输出错误信息,实验证明该攻击在多种标准数据集和模型上成功率很高,且难以被常规防御完全阻止。