🤖 系统
12-01 14:17
AudioStory:一个用于生成连贯长叙事音频的端到端统一框架 / AudioStory: Generating Long-Form Narrative Audio with Large Language Models
1️⃣ 一句话总结
本文提出了AudioStory,一个将大型语言模型与文本到音频生成系统集成的端到端框架,旨在通过交错推理生成和渐进式训练策略,解决现有模型在生成时间连贯、结构化的长叙事音频(如有声书、播客)方面的不足。