arXiv ID:
2605.28104
arXiv 提交日期: 2026-05-27
面向合作攻击的基于句子级修正的LLM多智能体系统防御方法 / Defending LLM-based Multi-Agent Systems Against Cooperative Attacks with Sentence-Level Rectification
1️⃣ 一句话总结
本文发现多智能体系统中的恶意智能体可以通过内部信息交换进行合作攻击,并为此提出了一种能动态协调的攻击框架,同时设计了一种句子级别的可信度分析与修正防御框架,有效识别和纠正智能体通信中的误导信息,大幅降低了合作攻击对系统任务成功率的影响。