arXiv ID:
2603.01639
arXiv 提交日期: 2026-03-02
学习草拟:基于强化学习的自适应推测解码 / Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为‘学习草拟’的新方法,它利用强化学习训练两个相互适应的策略来动态协调大语言模型的草拟和验证阶段,从而直接优化整体解码速度,在多种任务上实现了比现有最佳方法高出最多36.4%的加速效果。