arXiv ID:
2604.05397
arXiv 提交日期: 2026-04-07
置信度校准应不止于单轮对话 / Confidence Should Be Calibrated More Than One Turn Deep
1️⃣ 一句话总结
这篇论文指出,为了确保大语言模型在多轮对话中的安全可靠应用,必须对其置信度进行动态的、基于对话历史的校准,并提出了一种新方法和解码策略来提升多轮对话中的事实准确性和一致性。