arXiv ID:
2511.03276
扩散语言模型是超级数据学习者 / Diffusion Language Models are Super Data Learners
1️⃣ 一句话总结
这项研究发现,在数据有限的情况下,扩散语言模型通过多轮训练能持续超越自回归模型,这得益于其任意顺序建模、密集计算和内置数据增强能力,即使在小规模数据上也能取得优异的下游任务表现。