arXiv ID:
2601.07767
arXiv 提交日期: 2026-01-12
大语言模型的决策是否忠实于其口头表达的置信度? / Are LLM Decisions Faithful to Verbal Confidence?
1️⃣ 一句话总结
这篇论文通过一个名为RiskEval的评估框架发现,当前的大语言模型虽然能表达出看似合理的自我不确定性,但其口头上的置信度与实际决策行为脱节,即使在面临高错误惩罚时也不会明智地选择放弃回答,导致其可信度和实用性大打折扣。