arXiv ID:
2510.10023
arXiv 提交日期: 2025-10-11
技能导向的自适应训练 / Skill-Targeted Adaptive Training
1️⃣ 一句话总结
这篇论文提出了一种名为STAT的新方法,通过利用强大语言模型的元认知能力来识别学生模型的技能短板,并据此动态调整训练数据,从而在数学推理等任务上显著提升模型性能,且与强化学习方法互补。