arXiv ID:
2601.08587
无需结构引导的端到端视频人物替换 / End-to-End Video Character Replacement without Structural Guidance
1️⃣ 一句话总结
这篇论文提出了一种名为MoCha的新方法,它只需要一张任意帧的遮罩图,就能在复杂场景下实现高质量、时序连贯的视频人物替换,克服了以往方法依赖繁琐结构引导和配对数据的限制。