
摘要
近年来,点云处理网络架构的进展主要得益于局部聚合算子的新型设计。然而,由于各解决方案在整体网络结构和实现细节上存在差异,这些算子对网络性能的实际影响尚未得到充分研究。同时,大多数现有算子仅应用于浅层网络结构。本文重新审视了几种具有代表性的局部聚合算子,并在相同的深度残差网络架构下系统评估其性能表现。研究结果表明,尽管这些算子在设计上各不相同,但在相同输入规模和特征维度条件下,它们对网络性能的贡献出人意料地相似,并在标准基准测试中达到了当前最优的分类与分割精度。这一发现促使我们重新思考点云处理中对复杂局部聚合算子设计的必要性。为此,我们提出了一种无需可学习参数的简单局部聚合算子——位置池化(Position Pooling, PosPool),其性能与现有复杂算子相当,甚至在某些情况下略优。特别地,仅由PosPool层构成的简单深度残差网络,在所有基准测试中均表现出色,尤其在具有挑战性的PartNet数据集上,相比此前最优方法显著提升了7.4 mIoU。相关代码已公开发布于:https://github.com/zeliu98/CloserLook3D。
代码仓库
zeliu98/CloserLook3D
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-semantic-segmentation-on-partnet | closerlook3D | mIOU: 53.8 |