6 个月前

卷积神经网络

计算机视觉

Francesca Babiloni Ioannis Marras Filippos Kokkinos Jiankang Deng Grigorios Chrysos Stefanos Zafeiriou

摘要

空间自注意力层以非局部（Non-Local）模块的形式，通过计算所有可能位置之间的成对相似性，在卷积神经网络中引入长程依赖关系。这类成对函数构成了非局部层有效性的基础，但同时也导致其复杂度在空间和时间上均随输入规模呈二次方增长。这一特性成为实际应用中的严重瓶颈，使得非局部模块难以应用于中等规模的输入。以往的研究主要通过修改底层矩阵运算来降低复杂度，而本文则致力于在保持非局部层完整表达能力的前提下，实现线性复杂度。我们通过将非局部模块视为三阶多项式函数的特例，克服了其效率瓶颈。这一理论视角使我们能够提出新型的快速非局部模块，通过将成对相似性的直接计算替换为逐元素乘法，将复杂度从二次方降低至线性，且性能无任何损失。所提出的“Poly-NL”方法在图像识别、实例分割和人脸检测等任务中均达到与当前最先进方法相媲美的性能，同时显著降低了计算开销。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Francesca Babiloni Ioannis Marras Filippos Kokkinos Jiankang Deng Grigorios Chrysos Stefanos Zafeiriou

摘要

空间自注意力层以非局部（Non-Local）模块的形式，通过计算所有可能位置之间的成对相似性，在卷积神经网络中引入长程依赖关系。这类成对函数构成了非局部层有效性的基础，但同时也导致其复杂度在空间和时间上均随输入规模呈二次方增长。这一特性成为实际应用中的严重瓶颈，使得非局部模块难以应用于中等规模的输入。以往的研究主要通过修改底层矩阵运算来降低复杂度，而本文则致力于在保持非局部层完整表达能力的前提下，实现线性复杂度。我们通过将非局部模块视为三阶多项式函数的特例，克服了其效率瓶颈。这一理论视角使我们能够提出新型的快速非局部模块，通过将成对相似性的直接计算替换为逐元素乘法，将复杂度从二次方降低至线性，且性能无任何损失。所提出的“Poly-NL”方法在图像识别、实例分割和人脸检测等任务中均达到与当前最先进方法相媲美的性能，同时显著降低了计算开销。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供