arXiv ID:
2604.25441
arXiv 提交日期: 2026-04-28
Praxy Voice:基于冻结的非印度语言基座模型,零商业训练数据实现商业级印度语言语音合成 / Praxy Voice: Voice-Prompt Recovery + BUPS for Commercial-Class Indic TTS from a Frozen Non-Indic Base at Zero Commercial-Training-Data Cost
1️⃣ 一句话总结
本研究提出了一种方法,仅通过改进文本编码和语音提示恢复策略,无需训练新的声学解码器或使用任何商业语音数据,就能让一个原本不支持印度语言的强大多语言语音合成模型(Chatterbox)在泰卢固语、泰米尔语和印地语上达到甚至超过商业系统的音质水平。