arXiv ID:
2508.18621
arXiv 提交日期: 2025-08-26
万-S2V:音频驱动的影视视频生成 / Wan-S2V: Audio-Driven Cinematic Video Generation
1️⃣ 一句话总结
这篇论文提出了一种名为Wan-S2V的音频驱动视频生成模型,它能够根据音频创造出包含细腻角色互动、自然身体动作和动态镜头的高质量影视级视频,在表现力和真实感上显著优于现有技术。