🤖 系统
11-30 17:41
📄 论文总结
VIST3A:通过将多视角重建网络与视频生成器拼接实现文本到3D生成 / VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a Video Generator
1️⃣ 一句话总结
这篇论文提出了一种名为VIST3A的新方法,通过巧妙拼接文本生成视频模型和3D重建网络,并利用对齐优化技术,实现了从文字描述直接生成高质量、逼真的3D场景,效果优于现有主流技术。