← 返回列表

菜单

🤖 系统
📄 Abstract - Skill-Targeted Adaptive Training
正在获取摘要...
顶级标签: llm
详细标签: adaptive training skill targeting mathematical reasoning data synthesis performance saturation 或 搜索:

📄 论文总结

技能目标自适应训练方法 / Skill-Targeted Adaptive Training


1️⃣ 一句话总结

STAT是一种针对语言模型在监督微调后出现性能饱和问题的新型训练策略,通过利用强LLM的元认知能力识别学生模型的缺失技能,并针对性构建训练数据,显著提升模型在数学推理任务上的性能。


2️⃣ 论文创新点

1. STAT训练策略

2. 缺失技能档案

3. STAT-Sel数据选择方法

4. STAT-Syn数据合成方法

5. 持续学习变体


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF