arXiv ID:
2605.25998
arXiv 提交日期: 2026-05-25
因果方法在大型语言模型开发与评估中的应用 / Causal methods for LLM development and evaluation
1️⃣ 一句话总结
本文指出,大型语言模型的开发与评估中许多关键问题(如数据混合效果、偏好评估偏差、模型路由选择等)本质上属于因果关系问题,而当前基于纯预测的方法容易受到数据偏差和环境变化的影响,因此作者系统阐述了如何利用因果推断方法(如干预效应估计、去混杂等)来提升模型开发过程的可靠性和科学性。