← 返回列表

菜单

🤖 系统
📄 Abstract - TalkVid: A Large-Scale, High-Quality, and Diverse Dataset for Audio-Driven Talking Head Synthesis
正在获取摘要...
顶级标签: audio
详细标签: talking head generation audio-visual dataset video quality assessment synthetic media face animation 或 搜索:

📄 论文总结

TalkVid:一个用于音频驱动说话人生成的大规模高质量多样化数据集

TalkVid: A Large-Scale, High-Quality, and Diverse Dataset for Audio-Driven Talking Head Synthesis


1️⃣ 一句话总结

本文提出了TalkVid数据集,这是一个大规模、高质量、多样化的音频驱动说话人生成数据集,包含1244小时视频和7729名独特说话者,并通过多阶段自动化流程确保数据质量,同时发布了分层评估基准TalkVid-Bench用于全面评估模型性能。


2️⃣ 论文创新点

1. TalkVid数据集

2. TalkVid-Bench评估基准

3. 基于内容的三阶段过滤流程

4. TalkVid-Core高质量子集


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF