arXiv ID:
2603.05299
arXiv 提交日期: 2026-03-05
WavSLM:通过WavLM蒸馏实现单流语音语言建模 / WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation
1️⃣ 一句话总结
这篇论文提出了一种名为WavSLM的新型语音语言模型,它通过将自监督语音表征蒸馏并量化为单一码本,实现了无需文本监督、仅用单一数据流就能同时建模语音的语义和声学信息,从而简化了模型结构并支持流式推理。