arXiv ID:
2508.19205
arXiv 提交日期: 2025-08-26
VibeVoice技术报告 / VibeVoice Technical Report
1️⃣ 一句话总结
这篇论文提出了VibeVoice模型,它通过一种创新的连续语音分词器和扩散技术,能够高效合成长达90分钟、最多包含4位说话人的多角色长语音,并真实还原对话氛围,性能优于现有开源和商业模型。