arXiv ID:
2607.01893
arXiv 提交日期: 2026-07-02
Spec-AUF:面向掩码块起草器在训练与推理不一致下的“接受直到失败”训练方法 / Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters
1️⃣ 一句话总结
该论文提出了一种名为AUF的简单训练方法,通过仅保留草案块中直到第一个预测错误位置的交叉熵损失,解决了块式起草器在训练时对所有位置同等监督、而推理时只保留被接受前缀的矛盾,从而在不改变推理流程的前提下,显著提升了多个基准上的平均生成长度。