arXiv ID:
2606.03713
arXiv 提交日期: 2026-06-02
探究多模态大语言模型的对抗鲁棒性 / Investigating Adversarial Robustness of Multi-modal Large Language Models
1️⃣ 一句话总结
本文系统研究了多模态大语言模型如何抵抗视觉攻击,发现只有经过大规模多模态对抗训练的视觉编码器才能有效提升模型鲁棒性,且端到端对抗训练和轻量级测试时扰动防御能显著改善模型在图像描述、视觉问答等任务上的安全性,同时减少恶意诱导下的有害内容生成。