arXiv ID:
2603.28166
arXiv 提交日期: 2026-03-30
评估智能体在现实世界工具上的权限使用 / Evaluating Privilege Usage of Agents on Real-World Tools
1️⃣ 一句话总结
这篇论文提出了一个名为GrantBox的安全评估沙箱,用于测试配备了真实工具的AI智能体在面临复杂攻击时的权限使用安全性,发现即使AI具备基本安全意识,但在精心设计的攻击下其防御依然脆弱,平均攻击成功率高达84.8%。