8 个月前

卷积神经网络

计算机视觉

Changshuo Wang Meiqing Wu Siew-Kei Lam Xin Ning Shangshu Yu Ruiping Wang Weijun Li Thambipillai Srikanthan

摘要

尽管在点云理解的预训练方法方面取得了显著进展，但直接从不规则点云中捕捉复杂形状信息而不依赖外部数据仍然是一个艰巨的挑战。为了解决这一问题，我们提出了一种创新的基于全局感知和局部结构拟合的Transformer模型——GPSFormer，该模型能够以惊人的精度从点云中学习详细的形状信息。GPSFormer的核心组件是全局感知模块（Global Perception Module, GPM）和局部结构拟合卷积（Local Structure Fitting Convolution, LSFConv）。具体而言，GPM利用自适应变形图卷积（Adaptive Deformable Graph Convolution, ADGConv）来识别特征空间中相似特征之间的短程依赖关系，并通过多头注意力机制（Multi-Head Attention, MHA）来学习特征空间内所有位置之间的长程依赖关系，最终实现上下文表示的灵活学习。受泰勒级数的启发，我们设计了LSFConv，该卷积可以从显式编码的局部几何结构中同时学习低阶基本信息和高阶精细信息。将GPM和LSFConv作为基础组件进行整合，我们构建了GPSFormer这一前沿Transformer模型，能够有效捕捉点云的全局和局部结构。大量实验验证了GPSFormer在三个点云任务中的有效性：形状分类、部件分割和少样本学习。GPSFormer的代码可在以下网址获取：\url{https://github.com/changshuowang/GPSFormer}。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

计算机视觉

Changshuo Wang Meiqing Wu Siew-Kei Lam Xin Ning Shangshu Yu Ruiping Wang Weijun Li Thambipillai Srikanthan

摘要

尽管在点云理解的预训练方法方面取得了显著进展，但直接从不规则点云中捕捉复杂形状信息而不依赖外部数据仍然是一个艰巨的挑战。为了解决这一问题，我们提出了一种创新的基于全局感知和局部结构拟合的Transformer模型——GPSFormer，该模型能够以惊人的精度从点云中学习详细的形状信息。GPSFormer的核心组件是全局感知模块（Global Perception Module, GPM）和局部结构拟合卷积（Local Structure Fitting Convolution, LSFConv）。具体而言，GPM利用自适应变形图卷积（Adaptive Deformable Graph Convolution, ADGConv）来识别特征空间中相似特征之间的短程依赖关系，并通过多头注意力机制（Multi-Head Attention, MHA）来学习特征空间内所有位置之间的长程依赖关系，最终实现上下文表示的灵活学习。受泰勒级数的启发，我们设计了LSFConv，该卷积可以从显式编码的局部几何结构中同时学习低阶基本信息和高阶精细信息。将GPM和LSFConv作为基础组件进行整合，我们构建了GPSFormer这一前沿Transformer模型，能够有效捕捉点云的全局和局部结构。大量实验验证了GPSFormer在三个点云任务中的有效性：形状分类、部件分割和少样本学习。GPSFormer的代码可在以下网址获取：\url{https://github.com/changshuowang/GPSFormer}。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供