arXiv ID:
2604.00310
arXiv 提交日期: 2026-03-31
基于条件解码的鲁棒多模态安全防护 / Robust Multimodal Safety via Conditional Decoding
1️⃣ 一句话总结
这篇论文提出了一种名为CASA的简单条件解码策略,通过让多模态大模型在生成回复前先预测一个安全标记,有效抵御了利用跨模态交互发起的恶意攻击,在多种测试中将攻击成功率平均降低了97%以上,同时不影响正常任务的处理能力。