arXiv ID:
2602.16699
arXiv 提交日期: 2026-02-18
先校准后行动:大语言模型智能体中的成本感知探索 / Calibrate-Then-Act: Cost-Aware Exploration in LLM Agents
1️⃣ 一句话总结
这篇论文提出了一种名为‘先校准后行动’的新方法,通过让大语言模型在执行任务时(如信息检索或编程)明确权衡探索环境的成本与结果的不确定性,从而帮助它们做出更优的决策,比如决定何时停止测试代码并提交最终答案。