arXiv ID:
2604.12989
利用块扩散草稿树加速推测解码 / Accelerating Speculative Decoding with Block Diffusion Draft Trees
1️⃣ 一句话总结
这篇论文提出了一种名为DDTree的新方法,它通过改进现有的块扩散草稿模型,构建一个多分支的“草稿树”来预测更多可能的后续文本,从而让大型语言模型在生成文本时能一次性验证多个候选路径,显著提升了文本生成的速度和效率。