arXiv ID:
2602.14785
arXiv 提交日期: 2026-02-16
SA-SSL-MOS:基于谱增强自监督学习的广义多速率语音质量评估 / SA-SSL-MOS: Self-supervised Learning MOS Prediction with Spectral Augmentation for Generalized Multi-Rate Speech Assessment
1️⃣ 一句话总结
这篇论文提出了一种结合高频信息增强的自监督学习方法,通过一个并行分支架构和两步训练策略,有效解决了现有模型因训练数据局限于16kHz而无法准确评估多种采样率(16-48kHz)语音质量的问题,显著提升了多速率语音质量评估的泛化能力。