arXiv ID:
2604.19673
arXiv 提交日期: 2026-04-21
InHabit:利用图像基础模型实现可扩展的3D人物放置 / InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement
1️⃣ 一句话总结
本文提出一种名为InHabit的全自动数据生成方法,通过利用2D视觉语言模型和图像编辑模型的常识知识,将人物自然地放入3D场景中,从而大规模创建带有逼真人物交互的3D数据集,显著提升了3D人物场景重建和接触估计的性能。