arXiv ID:
2605.28533
arXiv 提交日期: 2026-05-27
基于预测下注的半监督假设检验 / Semi-Supervised Hypothesis Testing by Betting on Predictions
1️⃣ 一句话总结
本文提出一种新的统计检验方法,通过利用大量无标签数据中的预测信息来提升假设检验的效率,即使预测不准确也能保证结果可靠,并在语言模型评估等实际任务中表现出优于传统方法的性能。