arXiv ID:
2603.04219
arXiv 提交日期: 2026-03-04
ZeSTA:基于领域条件训练的零样本TTS增强方法,用于数据高效个性化语音合成 / ZeSTA: Zero-Shot TTS Augmentation with Domain-Conditioned Training for Data-Efficient Personalized Speech Synthesis
1️⃣ 一句话总结
这项研究提出了一种名为ZeSTA的新方法,它通过给合成语音和真实语音打上不同的“领域标签”来帮助模型区分两者,从而在数据极少的情况下,安全地利用大量合成语音来训练高质量的个性化语音合成模型,既提升了合成声音与目标说话人的相似度,又保持了语音的清晰度和自然度。