arXiv ID:
2604.01457
arXiv 提交日期: 2026-04-01
过度自信的根源:从机制视角看大语言模型中夸大的言语化自信 / Wired for Overconfidence: A Mechanistic Perspective on Inflated Verbalized Confidence in LLMs
1️⃣ 一句话总结
这篇论文通过分析大语言模型内部的工作机制,发现了一小部分特定的“电路”是导致模型在回答错误问题时仍然表现出过度自信的根源,并证明通过针对性地干预这些电路,可以有效改善模型对自己回答的可靠程度评估。