4 个月前

Mask3D:用于3D语义实例分割的Mask变换器

Mask3D:用于3D语义实例分割的Mask变换器

摘要

现代3D语义实例分割方法主要依赖于专门的投票机制,随后采用精心设计的几何聚类技术。借鉴近期基于Transformer的对象检测和图像分割方法的成功经验,我们提出了首个基于Transformer的3D语义实例分割方法。我们展示了如何利用通用的Transformer构建模块直接从3D点云预测实例掩码。在我们的模型Mask3D中,每个物体实例都表示为一个实例查询。通过使用Transformer解码器,这些实例查询可以通过迭代关注多尺度点云特征来学习。结合点特征,实例查询可以直接并行生成所有实例掩码。与当前最先进的方法相比,Mask3D具有多项优势,因为它既不依赖于(1)需要手动选择几何属性(如中心)的投票方案,也不依赖于(2)需要手动调整超参数(例如半径)的几何分组机制,并且(3)能够实现直接优化实例掩码的损失函数。Mask3D在ScanNet测试集上取得了新的最佳性能(+6.2 mAP),在S3DIS六折交叉验证上提升了10.1 mAP,在STPLS3D上提升了11.2 mAP,在ScanNet200测试集上则提升了12.4 mAP。

代码仓库

jonasschult/mask3d
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-instance-segmentation-on-s3disMask3D
AP@50: 75.5
mAP: 64.5
3d-instance-segmentation-on-scannet200Mask3D
mAP: 27.8
3d-instance-segmentation-on-scannetv2Mask3D
mAP: 55.2
mAP @ 50: 78.0
mAP@25: 87.0
3d-instance-segmentation-on-stpls3dMask3D
AP: 57.3
AP25: 81.6
AP50: 74.3
semantic-segmentation-on-replicaMask3D
mIoU: 22.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Mask3D:用于3D语义实例分割的Mask变换器 | 论文 | HyperAI超神经