arXiv ID:
2601.07264
arXiv 提交日期: 2026-01-12
置信度二分法:分析与缓解工具使用智能体中的校准错误 / The Confidence Dichotomy: Analyzing and Mitigating Miscalibration in Tool-Use Agents
1️⃣ 一句话总结
这篇论文发现,使用不同工具(如网络搜索或代码解释器)的大型语言模型智能体,其表达的信心与实际能力常常不匹配,并提出了一个通过强化学习同时优化任务准确性和信心校准的新方法,让智能体在各种任务中更可靠地表达其不确定性。