arXiv ID:
2512.06776
arXiv 提交日期: 2025-12-07
从下一个词到下一个块:扩散大语言模型的一种原则性适应路径 / From Next-Token to Next-Block: A Principled Adaptation Path for Diffusion LLMs
1️⃣ 一句话总结
这篇论文提出了一种新方法,能够高效地将现有的大语言模型(一次生成一个词)改造为扩散语言模型(一次生成一个文本块),从而在保持原有模型能力的同时,大幅提升文本生成速度,避免了从头训练的巨大成本。