arXiv ID:
2602.08696
arXiv 提交日期: 2026-02-09
基于原型的解耦可控构音障碍语音合成 / Prototype-Based Disentanglement for Controllable Dysarthric Speech Synthesis
1️⃣ 一句话总结
这篇论文提出了一种名为ProtoDisent-TTS的新方法,它能够将说话人的声音特质和构音障碍的发音特征分离开来,从而可以灵活地生成或转换健康语音与障碍语音,有效提升了语音识别和辅助技术的性能与可控性。