arXiv ID:
2601.18778
arXiv 提交日期: 2026-01-26
教模型自我教学:在可学习性边缘的推理 / Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability
1️⃣ 一句话总结
这篇论文提出了一个名为SOAR的自我改进框架,它让一个大语言模型扮演‘老师’,通过生成自己不会解的难题来为‘学生’版本的自己创建学习课程,从而在没有额外人工数据的情况下,成功突破了模型在解决高难度数学问题时的学习瓶颈。