arXiv ID:
2512.16229
arXiv 提交日期: 2025-12-18
LoPA:通过前瞻并行解码扩展扩散大语言模型推理 / LoPA: Scaling dLLM Inference via Lookahead Parallel Decoding
1️⃣ 一句话总结
这篇论文提出了一种名为LoPA的无训练即插即用算法,通过并行探索不同的候选令牌填充顺序并选择未来并行潜力最高的路径,将扩散大语言模型单次前向传递生成的令牌数量大幅提升至10个以上,从而显著加速了模型推理速度。