🤖 系统
11-30 17:39
📄 论文总结
技能导向的自适应训练 / Skill-Targeted Adaptive Training
1️⃣ 一句话总结
这篇论文提出了一种名为STAT的新方法,通过利用强大语言模型的元认知能力来识别学生模型的技能短板,并据此动态调整训练数据,从而在数学推理等任务上显著提升模型性能,且与强化学习方法互补。
请先 登录 后再提交论文
技能导向的自适应训练 / Skill-Targeted Adaptive Training
这篇论文提出了一种名为STAT的新方法,通过利用强大语言模型的元认知能力来识别学生模型的技能短板,并据此动态调整训练数据,从而在数学推理等任务上显著提升模型性能,且与强化学习方法互补。