arXiv ID:
2601.01592
OpenRT:一个用于多模态大语言模型的开源红队测试框架 / OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs
1️⃣ 一句话总结
这篇论文提出了一个名为OpenRT的开源、模块化框架,用于系统地测试和评估多模态大语言模型的安全性,发现即使是当前最先进的模型也存在显著的安全漏洞,平均攻击成功率高达49.14%。