arXiv ID:
2511.03601
arXiv 提交日期: 2025-11-05
Step-Audio-EditX 技术报告 / Step-Audio-EditX Technical Report
1️⃣ 一句话总结
这篇论文提出了首个基于大语言模型的开源音频编辑工具Step-Audio-EditX,它通过创新的合成数据训练方法,实现了对音频情感、说话风格等细节的高表现力编辑和零样本语音生成,并在多项任务中超越了现有先进模型。