arXiv ID:
2603.22216
arXiv 提交日期: 2026-03-23
用于并行文本生成的Gumbel蒸馏方法 / Gumbel Distillation for Parallel Text Generation
1️⃣ 一句话总结
这篇论文提出了一种名为Gumbel蒸馏的新技术,它通过一种确定性的映射方法,让能够并行解码的模型从高质量的串行生成模型中学习,从而在保持快速生成速度的同时,显著提升了生成文本的质量。