arXiv ID:
2606.13105
arXiv 提交日期: 2026-06-11
合成数据生成中的差异性影响 / Disparate Impact in Synthetic Data Generation
1️⃣ 一句话总结
这篇论文重新探讨了合成数据生成中的公平性问题,指出当合成数据与真实数据分布一致时,才能避免对不同敏感群体产生差异性影响,并分析了导致差异的原因及一种通过分组建模来改善公平性的策略。