arXiv ID:
2602.04577
arXiv 提交日期: 2026-02-04
用于语言模型不确定性量化的语义自蒸馏 / Semantic Self-Distillation for Language Model Uncertainty
1️⃣ 一句话总结
这篇论文提出了一种名为‘语义自蒸馏’的方法,通过训练一个轻量级的学生模型来快速预测大语言模型输出答案的语义分布,从而高效地估计模型的不确定性,用于检测模型可能产生的幻觉或不可靠回答。