arXiv ID:
2602.10780
arXiv 提交日期: 2026-02-11
用FIRE消灭它:利用潜在空间方向在运行时缓解深度神经网络的后门攻击 / Kill it with FIRE: On Leveraging Latent Space Directions for Runtime Backdoor Mitigation in Deep Neural Networks
1️⃣ 一句话总结
这篇论文提出了一种名为FIRE的运行时防御方法,它通过分析并逆向修正神经网络内部特征空间中由后门触发器引发的特定变化,从而在不修改已部署模型的情况下,高效地抵御各种后门攻击。