arXiv ID:
2603.06444
arXiv 提交日期: 2026-03-06
面向流式文本输入的基于大语言模型的语音合成:一种韵律边界感知的流式生成方法 / Prosodic Boundary-Aware Streaming Generation for LLM-Based TTS with Streaming Text Input
1️⃣ 一句话总结
这篇论文提出了一种新的训练策略,让基于大语言模型的语音合成系统在接收连续输入的文本时,能够智能地预测并停在合适的韵律边界处,从而有效解决了因看不到后续文本导致的语调不自然和长文本合成崩溃两大难题,显著提升了流式语音合成的质量和稳定性。