arXiv ID:
2607.01679
arXiv 提交日期: 2026-07-02
超越基于梯度的攻击:网络安全分类器中的对抗鲁棒性与可解释性稳定性 / Beyond Gradient-Based Attacks: Adversarial Robustness and Explainability Stability in Cybersecurity Classifiers
1️⃣ 一句话总结
本文针对网络安全分类器,发现传统对抗攻击(如基于梯度的攻击)在树模型上会产生误导性的鲁棒性评估,并首次提出了“可解释性稳定性指数”(ESI),证明即使模型预测看似稳健,其基于SHAP的解释也可能严重失真,因此需要同时衡量预测鲁棒性和解释稳定性,才能全面评估分类器的安全性。