arXiv ID:
2512.06589
arXiv 提交日期: 2025-12-06
OmniSafeBench-MM:一个用于多模态越狱攻击-防御评估的统一基准与工具箱 / OmniSafeBench-MM: A Unified Benchmark and Toolbox for Multimodal Jailbreak Attack-Defense Evaluation
1️⃣ 一句话总结
这篇论文提出了一个名为OmniSafeBench-MM的综合性工具箱与基准,用于系统评估多模态大语言模型在抵御诱导其产生有害内容的‘越狱攻击’方面的安全性,并集成了多种攻击与防御方法、覆盖广泛风险领域的数据集以及一个多维度的评估体系。