arXiv ID:
2604.02113
arXiv 提交日期: 2026-04-02
为大型语言模型引导推理选择可靠的控制点 / Reliable Control-Point Selection for Steering Reasoning in Large Language Models
1️⃣ 一句话总结
这篇论文发现,当前通过关键词匹配来引导大语言模型推理的方法大多不可靠,并提出了一种基于稳定性筛选的新方法,能有效识别并利用模型内部真正稳定的行为信号来提升数学推理等任务的性能,且该方法能在同架构模型间迁移。