
摘要
三维形状模型正变得越来越普及且易于获取,使得三维信息对于物体分类的进步至关重要。目前最先进的方法依赖于卷积神经网络(CNN)来解决这一问题。近期,我们见证了两种类型的CNN的发展:基于体素表示的CNN与基于多视图表示的CNN。这两种类型CNN的经验结果存在较大差距,表明现有的体素CNN架构和方法未能充分利用三维表示的优势。在本文中,我们旨在通过对现有方法进行广泛分析,改进体素CNN和多视图CNN。为此,我们引入了两种不同的体素CNN网络架构。此外,我们在多视图CNN中引入了三维多分辨率滤波。总体而言,我们能够在体素CNN和多视图CNN方面超越当前最先进的方法。我们设计了大量实验以评估基础设计选择,从而为用于三维数据物体分类的方法空间提供更好的理解。
代码仓库
LONG-9621/3DCNN
pytorch
GitHub 中提及
charlesq34/3dcnn.torch
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-object-recognition-on-modelnet40 | MVCNN-MultiRes | Accuracy: 93.8% |
| 3d-point-cloud-classification-on-modelnet40 | Subvolume | Overall Accuracy: 89.2 |