arXiv ID:
2605.13429
arXiv 提交日期: 2026-05-13
TokAlign++:通过更好的词元对齐推进词汇自适应 / TokAlign++: Advancing Vocabulary Adaptation via Better Token Alignment
1️⃣ 一句话总结
论文提出了一种名为TokAlign++的方法,通过将原始词汇和目标词汇视为两种语言并学习双向词元对齐词典,从而高效地调整大语言模型的词汇表,显著提升文本压缩率、保留模型能力,并使得不同模型之间的知识蒸馏更加有效。