arXiv ID:
2604.12491
arXiv 提交日期: 2026-04-14
面向表格问答的校准置信度估计 / Calibrated Confidence Estimation for Tabular Question Answering
1️⃣ 一句话总结
这篇论文首次系统性地研究了大型语言模型在表格问答任务中的置信度校准问题,发现模型普遍过于自信,并提出了一种名为‘多格式一致性’的新方法,该方法能利用表格数据的不同序列化格式来更准确、更低成本地估计模型答案的可靠性。