arXiv ID:
2603.14686
arXiv 提交日期: 2026-03-16
MVHOI:通过3D基础模型将多视角参考条件与复杂人-物交互视频重演相连接 / MVHOI: Bridge Multi-view Condition to Complex Human-Object Interaction Video Reenactment via 3D Foundation Model
1️⃣ 一句话总结
这篇论文提出了一种名为MVHOI的两阶段方法,它利用3D基础模型作为桥梁,结合多角度参考图像,能够生成包含复杂三维物体操控(如翻转、旋转)的、逼真且连贯的人与物体交互视频,效果显著优于现有技术。