arXiv ID:
2602.08498
复杂推理的特征刻画、评估与优化 / Characterizing, Evaluating, and Optimizing Complex Reasoning
1️⃣ 一句话总结
该论文提出了一个统一的框架,通过引入宏观与微观的评估原则、将推理过程建模为有向无环图并构建相应的奖励模型,来刻画、评估和优化大型推理模型中的复杂推理过程,从而显著提升模型在各种任务上的表现。