arXiv ID:
2606.24169
arXiv 提交日期: 2026-06-23
数据规模而非延迟决定了流式语音识别中跨语言编码器的迁移效果 / Data Scale, Not Latency, Shapes Cross-Lingual Encoder Transfer in Streaming ASR
1️⃣ 一句话总结
本文通过大规模实验发现,在将流式语音识别模型迁移到新语言时,使用多语言预训练编码器的优势主要取决于目标语言的数据量(数据少时优势明显,数据充足时优势消失),而与流式传输的延迟要求无关,同时模型量化对结果影响很小。