arXiv ID:
2602.20710
arXiv 提交日期: 2026-02-24
用于提升思维链忠实度的反事实模拟训练 / Counterfactual Simulation Training for Chain-of-Thought Faithfulness
1️⃣ 一句话总结
这篇论文提出了一种名为‘反事实模拟训练’的新方法,通过训练大语言模型使其思维链推理过程更忠实可靠,从而帮助人们更准确地理解模型决策背后的真实原因。