arXiv ID:
2604.04987
arXiv 提交日期: 2026-04-05
Cactus:通过约束接受推测采样加速自回归解码 / Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling
1️⃣ 一句话总结
这篇论文提出了一种名为Cactus的新方法,它通过一个受约束的优化框架来改进推测采样技术,在保证大模型输出质量基本不变的前提下,显著提升了文本生成的速度。