arXiv ID:
2605.13846
arXiv 提交日期: 2026-05-13
WARDEN:仅用6小时训练数据实现濒危土著语言的转录与翻译 / WARDEN: Endangered Indigenous Language Transcription and Translation with 6 Hours of Training Data
1️⃣ 一句话总结
本文提出了WARDEN系统,通过分离语音转录和文本翻译两个步骤,并结合跨语言初始化音频模型和专家字典辅助大语言模型的方法,仅用6小时标注数据就成功实现了澳大利亚濒危土著语言Wardaman的语音识别与英译,效果优于依赖大量数据的统一模型。