arXiv ID:
2602.17664
arXiv 提交日期: 2026-02-19
面向扩散语言模型的汇点感知剪枝 / Sink-Aware Pruning for Diffusion Language Models
1️⃣ 一句话总结
这篇论文发现扩散语言模型中的注意力汇点并不稳定,并据此提出了一种能自动识别并剪除这些不稳定汇点的新方法,从而在不重新训练模型的情况下,显著提升了模型推理效率与性能的平衡。