arXiv ID:
2606.12232
重新评估掩码扩散语言模型中的置信度重掩码方法 / Re-evaluating Confidence Remasking in Masked Diffusion Language Models
1️⃣ 一句话总结
本文通过实验发现,针对掩码扩散语言模型的一种无需重新训练的后处理置信度重掩码方法,在标准解码设置下几乎没有提升效果,而在非贪婪解码中虽能部分修正随机性带来的错误,但会加剧输出多样性降低的问题,因此该方法的效果高度依赖于具体使用场景。