arXiv ID:
2601.02179
arXiv 提交日期: 2026-01-05
大语言模型在多轮对话中的置信度估计 / Confidence Estimation for LLMs in Multi-turn Interactions
1️⃣ 一句话总结
这篇论文首次系统性地研究了大语言模型在多轮对话中的置信度估计问题,发现现有方法效果不佳,并提出了一种新的评估框架和一个表现相对更好的探测方法,为构建更可靠的对话智能体奠定了基础。