arXiv ID:
2603.25706
arXiv 提交日期: 2026-03-26
万维编织者:通过解耦训练实现交错式多模态生成 / Wan-Weaver: Interleaved Multi-modal Generation via Decoupled Training
1️⃣ 一句话总结
这篇论文提出了一个名为Wan-Weaver的模型,它通过将复杂的图文交错生成任务分解为文本规划和视觉一致性建模两个独立步骤来训练,从而在没有真实交错数据的情况下,也能生成内容连贯、视觉一致的多模态混合内容。