arXiv ID:
2512.09106
arXiv 提交日期: 2025-12-09
为扩散语言模型学习解掩码策略 / Learning Unmasking Policies for Diffusion Language Models
1️⃣ 一句话总结
这篇论文提出了一种使用强化学习来训练智能策略的方法,以自动决定在扩散语言模型生成文本的每一步中应该同时“揭开”哪些被掩盖的词语,从而在保证生成质量的同时提升效率,避免了传统手动调整启发式方法的不足。