arXiv ID:
2602.03100
arXiv 提交日期: 2026-02-03
Risky-Bench:探究现实世界部署下智能体的安全风险 / Risky-Bench: Probing Agentic Safety Risks under Real-World Deployment
1️⃣ 一句话总结
这篇论文提出了一个名为Risky-Bench的评估框架,旨在系统性地测试作为智能体在真实复杂环境中运行的大型语言模型所面临的安全风险,弥补了现有评估方法覆盖不全且适应性不足的缺陷,并在生活辅助场景中发现了现有先进智能体存在的显著安全隐患。