arXiv ID:
2602.10457
arXiv 提交日期: 2026-02-11
通过反事实数据集生成分析神经网络预测的公平性 / Analyzing Fairness of Neural Network Prediction via Counterfactual Dataset Generation
1️⃣ 一句话总结
这篇论文提出了一种新方法,通过巧妙地修改少量训练数据的标签来生成一个“反事实”数据集,然后重新训练模型,以此检测和解释神经网络预测结果是否依赖于训练数据中的偏见标签,从而评估模型的公平性。