arXiv ID:
2604.05417
arXiv 提交日期: 2026-04-07
基于对齐反馈的多起草者推测解码 / Multi-Drafter Speculative Decoding with Alignment Feedback
1️⃣ 一句话总结
这篇论文提出了一个名为MetaSD的统一框架,通过整合多个擅长不同任务的‘起草者’模型并利用反馈动态选择它们,来显著提升大语言模型的推理速度,同时保证生成质量。