4 个月前

用于点云自监督学习的掩码自动编码器

用于点云自监督学习的掩码自动编码器

摘要

作为一种有前景的自监督学习方案,掩码自动编码(Masked Autoencoding)在自然语言处理和计算机视觉领域取得了显著进展。受此启发,我们提出了一种用于点云自监督学习的简洁掩码自动编码器方案,旨在解决点云特性带来的挑战,包括位置信息泄露和信息密度不均等问题。具体而言,我们将输入的点云分割为不规则的点补丁,并以高比例随机掩码这些点补丁。然后,基于标准Transformer的自动编码器通过不对称设计和掩码标记移位操作从未被掩码的点补丁中学习高层次的潜在特征,目标是重建被掩码的点补丁。大量实验表明,我们的方法在预训练过程中效率高,并且在各种下游任务上具有良好的泛化能力。特别是,我们的预训练模型在ScanObjectNN数据集上达到了85.18%的准确率,在ModelNet40数据集上达到了94.04%的准确率,超过了所有其他自监督学习方法。我们证明了仅使用标准Transformer构建的简单架构可以超越监督学习中的专用Transformer模型。此外,我们的方法在少样本对象分类任务中将最先进水平提高了1.5%-2.3%。进一步地,我们的工作展示了将来自语言和图像领域的统一架构应用于点云的可能性。

代码仓库

liujia99/tpm
pytorch
GitHub 中提及
lmd0311/pointmamba
pytorch
GitHub 中提及
Pang-Yatian/Point-MAE
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-point-cloud-classification-on-modelnet40Point-MAE
Overall Accuracy: 94.0
3d-point-cloud-classification-on-scanobjectnnPoint-MAE
OBJ-BG (OA): 90.02
OBJ-ONLY (OA): 88.29
Overall Accuracy: 85.2
few-shot-3d-point-cloud-classification-on-1Point-MAE
Overall Accuracy: 96.3
Standard Deviation: 2.5
few-shot-3d-point-cloud-classification-on-2Point-MAE
Overall Accuracy: 97.8
Standard Deviation: 1.8
few-shot-3d-point-cloud-classification-on-3Point-MAE
Overall Accuracy: 92.6
Standard Deviation: 4.1
few-shot-3d-point-cloud-classification-on-4Point-MAE
Overall Accuracy: 95.0
Standard Deviation: 3.0
point-cloud-segmentation-on-pointcloud-cPointMAE
mean Corruption Error (mCE): 0.927

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于点云自监督学习的掩码自动编码器 | 论文 | HyperAI超神经