arXiv ID:
2601.15165
灵活性陷阱:为何任意顺序生成反而限制了扩散语言模型的推理潜力 / The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models
1️⃣ 一句话总结
这篇论文发现,尽管扩散大语言模型允许以任意顺序生成文本,理论上提供了更大的探索空间,但实际上这种灵活性会导致模型回避生成关键但不确定的词汇,反而限制了其解决复杂推理任务(如数学和编程)的能力;研究提出,放弃这种任意顺序的灵活性,采用一种更简单的优化方法,反而能显著提升模型性能。