arXiv ID:
2602.14469
arXiv 提交日期: 2026-02-16
测量并缓解逆向思维链生成中的事后合理化现象 / Measuring and Mitigating Post-hoc Rationalization in Reverse Chain-of-Thought Generation
1️⃣ 一句话总结
这篇论文发现,AI模型在根据答案倒推解释过程时,会不自觉地被答案‘锚定’而产生事后合理化,作者借鉴心理学理论提出了一种先规划结构再填充细节的新方法,有效降低了模型对答案的依赖,并提升了推理的可靠性。