arXiv ID:
2607.01965
arXiv 提交日期: 2026-07-02
面向语音学的多语言文本转语音系统评估 / Towards a Phonology-Informed Evaluation of Multilingual TTS
1️⃣ 一句话总结
本文提出了一种基于分类器的评估框架,通过对比人类语音的特定音系模式(如元音和谐),来检测多语言文本转语音系统是否准确重现了语言中用于区分词义和语法形式的关键声音对比,弥补了传统自然度评分(MOS)无法捕捉此类音系错误的不足。