← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: audio
详细标签: narrative audio generation diffusion transformer llm integration end-to-end framework audio benchmark 或 搜索:

📄 论文总结

AudioStory:一种端到端叙事音频生成框架

AudioStory: An End-to-End Framework for Narrative Audio Generation


1️⃣ 一句话总结

AudioStory是一个创新的端到端框架,通过结合大语言模型和扩散变换器,解决了长叙事音频生成中的时序连贯性和组合推理难题,并引入了首个叙事音频生成基准数据集AudioStory-10K。


2️⃣ 论文创新点

1. 解耦桥接机制

2. 端到端训练框架

3. 交错推理生成机制

4. 渐进式训练策略


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF