arXiv ID:
2603.09772
arXiv 提交日期: 2026-03-10
移除触发器而非后门:替代触发器与潜在后门 / Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors
1️⃣ 一句话总结
这篇论文挑战了传统观点,指出仅移除已知的后门触发器无法真正消除AI模型中的后门,因为存在多种感知上不同的替代触发器也能激活同一个后门,因此防御措施应针对特征空间中的后门方向,而非仅仅处理输入层面的触发器。