arXiv ID:
2602.14970
arXiv 提交日期: 2026-02-16
基于大语言模型的客服中心坐席质量保障系统的反事实公平性评估 / Counterfactual Fairness Evaluation of LLM-Based Contact Center Agent Quality Assurance System
1️⃣ 一句话总结
这项研究通过反事实公平性评估发现,尽管大语言模型能高效评估客服坐席表现,但其评估结果会因坐席的身份、对话背景和行为风格等特征而产生系统性偏差,且简单的提示词优化难以完全消除这种偏差,因此在关键的人力评估场景中部署前需进行标准化公平性审计。