arXiv ID:
2603.15259
arXiv 提交日期: 2026-03-16
用于鲁棒视觉语言模型的方向性嵌入平滑方法 / Directional Embedding Smoothing for Robust Vision Language Models
1️⃣ 一句话总结
这项研究提出了一种名为RESTA的轻量级防御方法,通过在模型推理时向嵌入向量中注入特定方向的噪声,有效降低了多种多模态越狱攻击的成功率,从而增强了视觉语言模型的安全性和可靠性。