arXiv ID:
2512.17901
arXiv 提交日期: 2025-12-19
推理定律(LORE):一个用于理解和改进大型推理模型的理论框架 / When Reasoning Meets Its Laws
1️⃣ 一句话总结
本文提出了一个名为‘推理定律(LORE)’的统一理论框架,旨在形式化大型推理模型(LRMs)的理想推理行为,并通过构建基准(LORE-BENCH)评估模型、开发微调方法(SFT-Compo)来增强模型对计算定律组合性的遵循,从而系统性提升模型的推理能力。