4 个月前

深度CNN与全局协方差池化:更好的表示和泛化能力

深度CNN与全局协方差池化:更好的表示和泛化能力

摘要

与现有深度卷积神经网络(CNNs)中的全局平均池化相比,全局协方差池化能够捕捉更丰富的深层特征统计信息,具有提高深度CNN表示能力和泛化能力的潜力。然而,将全局协方差池化集成到深度CNN中带来了两个挑战:(1) 在高维和小样本量的情况下进行稳健的协方差估计;(2) 合理利用协方差的几何特性。为了解决这些挑战,我们提出了一种全局矩阵幂归一化协方差(MPN-COV)池化方法。我们的MPN-COV符合一种稳健的协方差估计器,非常适合高维和小样本量的情况。它也可以被视为协方差之间的幂欧几里得度量(Power-Euclidean metric),有效地利用了它们的几何特性。此外,我们还提出了一种全局高斯嵌入网络,以将一阶统计信息纳入MPN-COV中。为了快速训练MPN-COV网络,我们实现了一种迭代矩阵平方根归一化方法,避免了MPN-COV固有的对GPU不友好的特征分解。另外,引入了渐进式1x1卷积和分组卷积来压缩协方差表示。所提出的这些方法具有高度模块化的特点,可以方便地集成到现有的深度CNN中。我们在大规模对象分类、场景分类、细粒度视觉识别和纹理分类等任务上进行了广泛的实验,结果表明我们的方法优于同类方法,并取得了最先进的性能。

基准测试

基准方法指标
image-classification-on-inaturalistiSQRT-COV-Net
Top 3 Error: 14.625
scene-classification-on-places365-standardiSQRT-COV-Net (ResNet-50)
Top 1 Error: 43.68
Top 5 Error: 13.73

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度CNN与全局协方差池化:更好的表示和泛化能力 | 论文 | HyperAI超神经