arXiv ID:
2604.02230
arXiv 提交日期: 2026-04-02
回答错误的问题:基于推理轨迹反演的大语言模型弃答机制 / Answering the Wrong Question: Reasoning Trace Inversion for Abstention in LLMs
1️⃣ 一句话总结
这篇论文提出了一种名为‘推理轨迹反演’的新方法,通过比较大语言模型实际回答的问题与原始问题的差异,来更准确地判断模型何时应该‘弃答’(即不回答),从而显著提升了模型在复杂任务中的自知之明和可靠性。