
摘要
深度神经网络在各种视觉任务中取得了显著的成功,然而将卷积神经网络(CNNs)应用于缺乏规则底层结构的领域(如3D点云)仍然具有挑战性。为此,我们提出了一种新颖的卷积架构,称为SpiderCNN,以高效地从点云中提取几何特征。SpiderCNN由称为SpiderConv的单元组成,这些单元通过参数化一组卷积滤波器,将卷积操作从规则网格扩展到可以嵌入R^n中的不规则点集。我们将滤波器设计为一个简单步进函数与泰勒多项式的乘积形式,其中步进函数用于捕捉局部测地线信息,而泰勒多项式则确保了模型的表达能力。SpiderCNN继承了经典CNNs的多尺度层次结构,这使得它能够提取语义深层特征。在ModelNet40上的实验表明,SpiderCNN在标准基准测试中达到了92.4%的最先进准确率,并在分割任务上表现出竞争力。
代码仓库
xyf513/SpiderCNN
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-part-segmentation-on-intra | SpiderCNN | DSC (A): 75.82 DSC (V): 94.53 IoU (A): 67.25 IoU (V): 90.16 |
| 3d-part-segmentation-on-shapenet-part | SpiderCNN | Class Average IoU: 82.4 Instance Average IoU: 85.3 |
| 3d-point-cloud-classification-on-intra | SpiderCNN | F1 score (5-fold): 0.872 |
| 3d-point-cloud-classification-on-modelnet40 | SpiderCNN | Overall Accuracy: 92.4 |
| 3d-point-cloud-classification-on-scanobjectnn | SpiderCNN | Mean Accuracy: 69.8 Overall Accuracy: 73.7 |