arXiv ID:
2604.25109
arXiv 提交日期: 2026-04-28
面向不可信智能体技能的结构化安全审计与鲁棒性增强 / Structured Security Auditing and Robustness Enhancement for Untrusted Agent Skills
1️⃣ 一句话总结
本文提出了一种名为SkillGuard-Robust的系统,通过在加载前对智能体技能包进行跨文件的角色感知证据提取、语义验证和一致性裁决,将安全审计从简单的单次提示过滤升级为鲁棒的三分类任务,实验表明该方法能有效抵御恶意改写攻击,并在多数据集中达到97%以上的安全检测准确率。