arXiv ID:
2603.02896
arXiv 提交日期: 2026-03-03
3D-DRES:精细化的三维指代表达式分割 / 3D-DRES: Detailed 3D Referring Expression Segmentation
1️⃣ 一句话总结
这篇论文提出了一个名为3D-DRES的新任务和一个配套数据集DetailRefer,旨在通过将自然语言描述中的每个名词短语精确映射到三维场景中的对应物体部件,来实现比现有方法更精细的三维视觉-语言理解,并展示了该方法不仅能提升短语级分割精度,还能意外地改善传统的句子级三维指代表达式分割性能。