arXiv ID:
2512.10858
离散扩散语言模型的缩放行为研究 / Scaling Behavior of Discrete Diffusion Language Models
1️⃣ 一句话总结
这篇论文研究发现,作为自回归模型替代方案的离散扩散语言模型,其性能随规模扩展的规律(缩放定律)与噪声类型密切相关,其中均匀扩散模型在数据有限时更具优势,并通过训练百亿参数模型验证了这一规律。