arXiv ID:
2604.11309
arXiv 提交日期: 2026-04-13
香肠切片威胁:利用LLM系统中的累积风险 / The Salami Slicing Threat: Exploiting Cumulative Risks in LLM Systems
1️⃣ 一句话总结
这篇论文提出了一种名为‘香肠切片攻击’的新型多轮越狱方法,通过串联大量看似无害的对话,逐步累积恶意意图来绕过大语言模型的安全防护,并在多种主流模型上取得了极高的攻击成功率,同时论文也提出了相应的防御策略。