🤖 系统
11-30 17:24
📄 论文总结
TalkVid:一个用于音频驱动说话头合成的大规模多样化数据集 / TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis
1️⃣ 一句话总结
这篇论文提出了一个名为TalkVid的大规模、高质量、多样化数据集,旨在解决当前音频驱动说话头生成模型在种族、语言和年龄群体上泛化能力不足的问题,并通过实验证明使用该数据集训练的模型具有更好的跨数据集泛化性能。