arXiv ID:
2604.12616
arXiv 提交日期: 2026-04-14
每张图片都讲述一个危险的故事:针对视觉语言模型的记忆增强多智能体越狱攻击 / Every Picture Tells a Dangerous Story: Memory-Augmented Multi-Agent Jailbreak Attacks on VLMs
1️⃣ 一句话总结
这篇论文提出了一个名为MemJack的新型攻击框架,它利用多智能体协作和记忆机制,通过挖掘图片本身的深层语义来生成恶意指令,从而高效地‘越狱’视觉语言模型,揭示了现有模型在语义安全上的重大漏洞。