arXiv ID:
2606.03504
BaltiVoice:巴尔蒂语语音语料库及基于Whisper微调的语音识别系统 / BaltiVoice: A Speech Corpus and Fine-tuned Whisper ASR System for the Balti Language
1️⃣ 一句话总结
本文构建了首个公开的巴尔蒂语语音语料库(16.8小时),并通过微调Whisper-small模型将其语音识别词错误率从182.18%大幅降低至30.07%,为这一资源匮乏的藏语方言提供了完整的开源语音识别解决方案。