arXiv ID:
2604.18204
arXiv 提交日期: 2026-04-20
难以被听清:针对音系复杂、资源匮乏濒危语言的音素级自动语音识别分析 / Hard to Be Heard: Phoneme-Level ASR Analysis of Phonologically Complex, Low-Resource Endangered Languages
1️⃣ 一句话总结
这篇论文通过分析两种濒危高加索语言的少量语音数据发现,在资源极度匮乏的情况下,自动语音识别的错误主要源于数据不足而非语言本身的复杂性,并且通过引入针对性的音素词汇表可以显著提升识别效果。