← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: 4d generation single-image 3d video diffusion models 6d video representation pseudo-annotation dataset 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文提出了首个前馈式(feed-forward)框架4DNeX,它能够仅从单张输入图像高效地生成动态的4D场景表示(即外观和几何都随时间变化的3D场景),其核心创新在于构建了大规模高质量训练数据集4DNeX-10M,并提出了一种统一的6D视频(RGB+XYZ序列)表示法及一系列模型适配策略,成功地将预训练视频扩散模型的强大生成能力迁移到了极具挑战性的4D生成任务上,为实现高效、可控的4D内容创建开辟了新道路。


2️⃣ 论文创新点

创新点一:首个前馈式单图像到4D生成框架 (4DNeX)

创新点二:大规模高质量4D数据集 (4DNeX-10M)

创新点三:统一的6D视频表示与融合策略

创新点四:高效的预训练模型适配策略


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF