arXiv ID:
2606.26797
arXiv 提交日期: 2026-06-25
推理质量早期涌现:面向推理模型的数据筛选 / Reasoning Quality Emerges Early: Data Curation for Reasoning Models
1️⃣ 一句话总结
这篇论文发现,只需检查模型在生成推理过程开头几步时的表现,就能高效筛选出困难且多样化的推理问题,从而用更少的数据和更低的成本训练出更强的推理能力,在医疗和数学推理任务上取得了更好的效果。