arXiv ID:
2605.01796
arXiv 提交日期: 2026-05-03
超越ECE:校准尺寸比、风险评估与置信加权指标 / Beyond ECE: Calibrated Size Ratio, Risk Assessment, and Confidence-Weighted Metrics
1️⃣ 一句话总结
本文指出传统校准评估指标ECE无法有效捕捉过度置信风险,提出新的校准尺寸比(CSR)来量化风险,并引入置信加权准确率(cwA)等指标以同时衡量模型是否具备区分正确与错误预测的能力,实验表明新方法能更好识别有风险的置信输出。