arXiv ID:
2606.24320
arXiv 提交日期: 2026-06-23
ZONOS2 技术报告 / ZONOS2 Technical Report
1️⃣ 一句话总结
本文介绍了新一代文本转语音模型ZONOS2 8B,通过采用混合专家架构、大规模扩展训练数据至600万小时以及优化训练流程,在语音自然度、韵律和声音克隆保真度上达到业界领先水平,同时保持了低延迟的流式处理能力,并开源了模型权重和推理代码。