arXiv ID:
2603.02719
arXiv 提交日期: 2026-03-03
多模态临床状况分类中校准与选择性预测的实证分析 / An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification
1️⃣ 一句话总结
这篇论文研究发现,在基于多模态ICU数据的临床状况分类任务中,尽管模型的标准评估指标表现良好,但其不确定性估计存在严重校准问题,导致模型在选择性预测(即将不确定的预测交由专家审核)时性能大幅下降,尤其对少数类别的预测不可靠,这揭示了当前评估方法在保障临床AI安全方面的局限性。