← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: 3d occupancy grounding vision-language fusion voxel perception autonomous driving robotics interaction 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文提出了3D occupancy grounding这一新任务,通过自然语言描述在3D场景中精确定位物体并预测其体素级占据空间,解决了传统边界框方法难以捕捉不规则形状或部分遮挡物体的问题;作者设计了端到端模型GroundingOcc并构建了首个多模态基准数据集Talk2Occ,实现了从粗到细的空间感知,为自动驾驶和人机交互提供了更精细的解决方案。


2️⃣ 论文创新点

1. 任务创新:定义3D occupancy grounding

2. 方法创新:GroundingOcc框架

3. 数据创新:Talk2Occ基准

4. 技术子创新


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表


(总结已合并重复术语与创新点,剔除冗余信息,突出核心贡献与跨学科可读性。)

📄 打开原文 PDF