arXiv ID:
2605.02496
arXiv 提交日期: 2026-05-04
藏语TTS:基于大模型适配的低资源藏语语音合成 / Tibetan-TTS:Low-Resource Tibetan Speech Synthesis with Large Model Adaptation
1️⃣ 一句话总结
本文提出了首个基于大模型的藏语语音合成系统,通过改进文本表示、分词器适配和跨语言自适应训练,在数据稀缺的情况下实现了高质量、自然的藏语语音输出,音质和发音准确率均超过商用接口。