arXiv ID:
2512.23988
arXiv 提交日期: 2025-12-30
奇妙的推理行为及其发现:推理过程的非监督式探索 / Fantastic Reasoning Behaviors and Where to Find Them: Unsupervised Discovery of the Reasoning Process
1️⃣ 一句话总结
这篇论文提出了一种名为RISE的非监督框架,通过稀疏自编码器在大语言模型的激活空间中自动发现并分离出可解释的推理行为(如反思、回溯),并能对这些行为进行针对性干预以可控地引导模型的推理过程,而无需重新训练模型。