arXiv ID:
2602.05393
arXiv 提交日期: 2026-02-05
晚到早训练:让大语言模型学得更早,从而更快更好 / Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better
1️⃣ 一句话总结
这篇论文提出了一种名为‘晚到早训练’的新方法,它利用一个已经训练好的小模型来指导一个新的大模型在训练初期就学习到更深层的知识,从而显著加快训练速度并提升最终性能。