arXiv ID:
2604.08005
arXiv 提交日期: 2026-04-09
注意力集中引导偏好重定向:一种针对计算机使用代理的攻击 / Preference Redirection via Attention Concentration: An Attack on Computer Use Agents
1️⃣ 一句话总结
这篇论文提出了一种名为PRAC的新型攻击方法,它通过在图形界面上植入一个隐蔽的对抗性补丁来误导计算机使用代理的视觉注意力,从而操纵其在网购等任务中的选择行为,即使代理模型经过微调,这种攻击依然有效,揭示了基于多模态大模型的智能代理在视觉模态上存在新的安全漏洞。