arXiv ID:
2606.09084
arXiv 提交日期: 2026-06-08
上下文碎片分解攻击:利用工件来源间隙攻破使用工具的LLM智能体 / Context-Fractured Decomposition Attacks on Tool-Using LLM Agents: Exploiting Artifact Provenance Gaps
1️⃣ 一句话总结
这篇论文发现,当大语言模型智能体在多个步骤、工具或不同时间点使用文件等“工件”时,由于系统无法追踪这些工件的完整来源(即“来源间隙”),攻击者可以分步注入看似无害的指令,诱使智能体在很久之后组合这些指令产生有害行为,从而绕过现有安全防护,成功率最高可提升28.3个百分点。