arXiv ID:
2605.15030
arXiv 提交日期: 2026-05-14
WARD:针对提示注入攻击的网络智能体鲁棒防御方法 / WARD: Adversarially Robust Defense of Web Agents Against Prompt Injections
1️⃣ 一句话总结
本文提出了一种名为WARD的防御模型,通过构建大规模数据集和自适应对抗训练框架,有效保护网络智能体免受网页中恶意提示注入攻击,同时保持高检测准确率和低误报率,且不增加运行延迟。