🤖 系统
11-30 17:50
📄 论文总结
UniAVGen:基于非对称跨模态交互的统一音视频生成框架 / UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions
1️⃣ 一句话总结
这篇论文提出了一个名为UniAVGen的统一音视频生成框架,通过创新的跨模态交互机制有效解决了现有方法在口型同步和语义一致性上的不足,并能在单一模型中实现多种音视频生成任务,同时大幅减少了训练数据需求。