arXiv ID:
2603.15803
arXiv 提交日期: 2026-03-16
DLLM需要的是掩码:一种用于扩散大语言模型的掩码数据训练范式 / Mask Is What DLLM Needs: A Masked Data Training Paradigm for Diffusion LLMs
1️⃣ 一句话总结
这篇论文提出了一种根据信息密度来智能调度训练噪声的新方法,通过优先掩码关键信息,让扩散语言模型同时学好逻辑推理和语法结构,从而在代码和数学推理任务上显著提升性能。