arXiv ID:
2601.09575
OpenVoxel:面向开放词汇3D场景理解的免训练体素分组与描述方法 / OpenVoxel: Training-Free Grouping and Captioning Voxels for Open-Vocabulary 3D Scene Understanding
1️⃣ 一句话总结
这篇论文提出了一种名为OpenVoxel的免训练算法,它能够自动将3D场景中的稀疏体素聚合成有意义的物体组,并利用大语言模型为每个组生成文字描述,从而无需额外训练即可实现对复杂3D场景的开放词汇理解和分割。