4 个月前

3D-SIS:RGB-D 扫描的三维语义实例分割

3D-SIS:RGB-D 扫描的三维语义实例分割

摘要

我们介绍了一种名为3D-SIS的新颖神经网络架构,用于在普通RGB-D扫描中进行三维语义实例分割。我们的方法的核心思想是从几何信号和颜色信号中联合学习,从而实现精确的实例预测。与仅在二维图像上操作的方法不同,我们注意到大多数计算机视觉应用都具有多视角RGB-D输入可用,因此我们利用这一点构建了一种有效的融合多模态输入的三维实例分割方法。我们的网络通过将高分辨率的RGB输入与基于三维重建的姿态对齐的体素网格关联起来,充分利用了这些高分辨率的RGB输入。对于每张图像,我们首先通过一系列二维卷积提取每个像素的二维特征;然后将生成的特征向量反投影到3D网格中的相应体素。这种2D和3D特征学习的结合使得物体检测和实例分割的准确性显著高于现有最先进的替代方案。我们在合成数据集和真实世界公开基准上展示了实验结果,在真实世界数据上的mAP(平均精度均值)提高了超过13个百分点。

代码仓库

Sekunde/3D-SIS
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-instance-segmentation-on-scannetv23D-SIS
mAP @ 50: 38.2
3d-object-detection-on-scannetv23D-SIS
mAP@0.25: 40.2
mAP@0.5: 22.5
3d-semantic-instance-segmentation-on-13D-SIS
mAP@0.50: 38.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
3D-SIS:RGB-D 扫描的三维语义实例分割 | 论文 | HyperAI超神经