arXiv ID:
2604.21549
arXiv 提交日期: 2026-04-23
使用多校准大型语言模型进行无偏的流行率估计 / Unbiased Prevalence Estimation with Multicalibrated LLMs
1️⃣ 一句话总结
本文提出,通过多校准技术(确保模型在不同输入特征下均保持校准)而非传统平均校准,可以显著消除在人群特征分布变化时(如跨地区或跨场景)使用大语言模型或分类器进行类别比例估计的系统性偏差,并通过模拟和实际案例验证了这一方法的效果。