arXiv ID:
2605.21541
面向闭源多模态大模型可迁移攻击的频域正则化对抗对齐方法 / Frequency-Domain Regularized Adversarial Alignment for Transferable Attacks against Closed-Source MLLMs
1️⃣ 一句话总结
本文提出一种名为FRA-Attack的攻击方法,通过在频域中对图像扰动进行双重正则化(高通滤波对齐视觉关注区域、低通滤波去除模型特有噪声),使得在开源模型上生成的攻击样本能更有效地欺骗GPT、Claude等闭源多模态大模型,并取得了当前最好的跨模型迁移攻击效果。