arXiv ID:
2605.28013
KSAFE-MM:一种通过本地化情境构建的韩国文化风险多模态安全基准 / KSAFE-MM: A Multimodal Safety Benchmark via Localized Contextualization for Korean Cultural Risks
1️⃣ 一句话总结
该论文提出了一个名为KSAFE-MM的多模态安全评估基准,专门针对韩国文化背景,通过将通用的安全测试问题“本地化”为包含韩国语言、视觉和文化元素的多模态样本,揭示了当前主流多模态大模型在面对文化特定攻击时比面对通用攻击更脆弱,且存在安全性与过度拒绝之间的权衡问题。