arXiv最新AI论文速览速学

🔍

标签: #facial animation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization 03-10

arXiv ID: 2603.08645

arXiv 提交日期: 2026-03-09

computer vision multi-modal model training head avatars expression generalization retrieval augmentation 3d reconstruction facial animation

检索增强的高斯化身：改进表情泛化能力 / Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

1️⃣ 一句话总结

这篇论文提出了一种名为RAF的简单训练增强方法，通过从外部表情库中检索并替换部分训练表情，让无模板的3D头部化身模型能够学习更广泛的表情变化，从而显著提升其表情生成的质量和泛化能力，而无需额外的配对数据或修改模型结构。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10516

arXiv 提交日期: 2026-02-11

computer vision multi-modal aigc 3d talking avatar audio-driven generation lip synchronization facial animation virtual humans

3DXTalker：在富有表现力的3D说话数字人中统一身份、唇形同步、情感与空间动态 / 3DXTalker: Unifying Identity, Lip Sync, Emotion, and Spatial Dynamics in Expressive 3D Talking Avatars

1️⃣ 一句话总结

这篇论文提出了一个名为3DXTalker的新方法，它通过创新的数据处理、丰富的音频特征和可控的空间动态生成技术，在一个统一的框架内解决了3D说话数字人生成中身份保持、唇形同步、情感表达和头部姿态自然运动等多个关键难题，显著提升了数字人的表现力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.13618

arXiv 提交日期: 2025-08-19

computer vision aigc data talking head synthesis dataset facial animation demographic diversity evaluation benchmark

TalkVid：一个用于音频驱动说话头合成的大规模多样化数据集 / TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis

1️⃣ 一句话总结

这篇论文提出了一个名为TalkVid的大规模、高质量、多样化数据集，旨在解决当前音频驱动说话头生成模型在种族、语言和年龄群体上泛化能力不足的问题，并通过实验证明使用该数据集训练的模型具有更好的跨数据集泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.08645

1️⃣ 一句话总结

arXiv ID: 2602.10516

1️⃣ 一句话总结

arXiv ID: 2508.13618

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.08645 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10516 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.13618 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.08645

arXiv ID: 2602.10516

arXiv ID: 2508.13618