arXiv ID:
2602.08794
arXiv 提交日期: 2026-02-09
MOVA:迈向可扩展且同步的视频-音频生成 / MOVA: Towards Scalable and Synchronized Video-Audio Generation
1️⃣ 一句话总结
这篇论文介绍了一个名为MOVA的开源模型,它能够一次性生成高质量且口型、音效、音乐都与画面内容同步的视听内容,旨在解决现有生成模型常忽略音频或依赖低效级联流程的问题。