arXiv ID:
2603.23055
arXiv 提交日期: 2026-03-24
选择后分布模型评估 / Post-Selection Distributional Model Evaluation
1️⃣ 一句话总结
这篇论文提出了一种名为PS-DME的新方法,它能在用户从候选模型中筛选出部分模型后,依然准确、无偏差地评估这些模型在不同可靠性水平下的性能表现,从而帮助用户更可靠地权衡模型的性能与稳定性。