arXiv ID:
2604.25819
arXiv 提交日期: 2026-04-28
相互强制:面向快速自回归音视频人物生成的雙模自演化框架 / Mutual Forcing: Dual-Mode Self-Evolution for Fast Autoregressive Audio-Video Character Generation
1️⃣ 一句话总结
本文提出了一种名为“相互强制”的新方法,能够直接训练一个快速、自回归式的音视频联合生成模型,通过让模型同时使用少量步骤和多个步骤两种生成模式并共享参数、互相促进,从而在仅需4到8步采样的情况下,达到或超越传统需要约50步采样的方法,显著提升了音视频生成的效率和质量。