arXiv ID:
2605.28070
arXiv 提交日期: 2026-05-27
弥合推理模型在信息不足时的检测与拒绝回答之间的差距 / Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information
1️⃣ 一句话总结
本文发现大型推理模型在遇到信息不足的问题时,虽然能察觉到问题不完整,却往往仍会继续推理并给出无依据的答案,而非主动拒绝回答;为解决这一危险差距,作者提出了一种“先判断、再求解”的控制框架,通过在生成解决方案前先让模型判断是否可答,若不可答则提前终止推理,从而大幅提升模型在不确定场景下安全拒绝回答的能力,并减少不必要的计算浪费。