arXiv ID:
2605.28626
arXiv 提交日期: 2026-05-27
当可解释性分配不均:混合可解释模型中的公平性问题 / When Interpretability Is Unequally Distributed: Fairness in Hybrid Interpretable Models
1️⃣ 一句话总结
本文发现,混合可解释模型(一部分数据由透明模型解释,另一部分交给黑箱模型)可能导致某些人群系统性地获得可解释决策、而其他人群更多被交给黑箱处理,作者将这种不公平定义为“可解释性覆盖差异”,并通过实验证明在中间透明度区间这一问题尤为严重,进而提出了简单有效的约束方法来缓解这种分配不均,且不影响模型准确率。