arXiv ID:
2606.11805
arXiv 提交日期: 2026-06-10
TextHOI-3D:基于离散多视图生成与联合网格优化的文本到3D手物交互生成 / TextHOI-3D: Text-to-3D Hand-Object Interaction via Discrete Multi-View Generation and Joint Mesh Optimization
1️⃣ 一句话总结
本文提出一个两阶段框架,先根据文本提示生成手与物体交互的多视角离散图像,再通过联合优化将这些图像重建为高质量、无穿透的3D手物网格模型,显著提升了从文字生成3D手物交互的几何精度和物理合理性。