arXiv ID:
2601.06786
arXiv 提交日期: 2026-01-11
EpiCaR:让大语言模型知道“自己不知道什么”对提升推理能力至关重要 / EpiCaR: Knowing What You Don't Know Matters for Better Reasoning in LLMs
1️⃣ 一句话总结
这篇论文提出了一种名为EpiCaR的新训练方法,它通过同时优化大语言模型的推理能力和自我评估能力,解决了现有方法导致模型过度自信的问题,从而在保持高准确率的同时,让模型能更好地判断自己何时可能出错,最终还能大幅减少推理所需的计算量。