4 个月前

MSTA3D:用于3D实例分割的多尺度双注意力机制

MSTA3D:用于3D实例分割的多尺度双注意力机制

摘要

近年来,基于变换器的技术结合超点(superpoints)在三维实例分割中变得越来越普遍。然而,这些方法经常遇到过度分割的问题,特别是在处理大型物体时尤为明显。此外,由于超点掩码预测的不可靠性,这一问题进一步加剧。为了解决这些挑战,我们提出了一种称为MSTA3D的新框架。该框架利用多尺度特征表示,并引入了双注意力机制,以有效捕捉这些特征。此外,MSTA3D集成了一个带有盒正则化的盒查询,为语义查询提供了补充的空间约束。在ScanNetV2、ScanNet200和S3DIS数据集上的实验评估表明,我们的方法超越了现有的最先进的三维实例分割方法。

基准测试

基准方法指标
3d-instance-segmentation-on-s3disMSTA3D
AP@50: 70.0
mPrec: 80.6
mRec: 70.1
3d-instance-segmentation-on-scannet200MSTA3D
mAP: 26.2
mAP@25: 40.1
mAP@50: 35.2
3d-instance-segmentation-on-scannetv2MSTA3D
mAP: 56.9
mAP @ 50: 79.5
mAP@25: 87.9
mRec: 74.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MSTA3D:用于3D实例分割的多尺度双注意力机制 | 论文 | HyperAI超神经