arXiv ID:
2601.20900
arXiv 提交日期: 2026-01-28
基于大语言模型的语音识别系统通过文本去噪实现纯文本适应 / Text-only adaptation in LLM-based ASR through text denoising
1️⃣ 一句话总结
这篇论文提出了一种新颖的纯文本适应方法,通过将语音投影任务模拟为文本去噪任务,让大语言模型从带噪声的文本中恢复干净的转录,从而在无需修改模型结构或增加参数的情况下,有效适应新领域并保持语音与文本的对齐,显著提升了语音识别性能。