3 个月前

CNN滤波器数据库:对训练后卷积滤波器的实证研究

CNN滤波器数据库:对训练后卷积滤波器的实证研究

摘要

目前,关于卷积神经网络(Convolutional Neural Networks, CNNs)的可迁移性与鲁棒性,仍存在诸多理论及实际应用层面尚未解决的关键问题。尽管当前研究正从多个角度致力于攻克这些挑战,但在大多数计算机视觉相关任务中,这些方法均可推广至对图像数据分布偏移(distribution shifts)影响的分析。在此背景下,我们提出从训练后CNN模型所学习权重的分布变化角度开展研究。本文重点关注广泛使用的3×3卷积核滤波器权重分布的特性。为此,我们收集并公开发布了一个大规模数据集,其中包含来自数百个训练好的CNN模型的超过14亿个卷积核滤波器,覆盖多种数据集、网络架构及视觉任务。该数据集为研究CNN权重分布特性提供了丰富的实证基础。在该数据集的首个应用场景中,我们揭示了大量公开预训练模型在实际应用中的若干关键性质:I)我们系统分析了在不同元参数维度(如数据集的视觉类别、任务类型、网络架构、层深度等)下,训练后滤波器分布的变化情况。基于分析结果,我们得出结论:只要目标数据集满足一定的规模与多样性条件,模型预训练便可在任意数据集上成功实现。II)我们发现,许多现有的预训练模型中存在退化(degenerated)滤波器,这类滤波器会降低模型的整体鲁棒性,并使其在下游目标任务上的微调(fine-tuning)性能受到显著影响。数据集与项目主页:https://github.com/paulgavrikov/cnn-filter-db

代码仓库

paulgavrikov/cnn-filter-db
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-cifar-10ResNet-9
Percentage correct: 94.79
image-classification-on-cifar-100ResNet-9
Percentage correct: 75.59
image-classification-on-fashion-mnistInception v3
Accuracy: 94.44
Percentage error: 5.56
image-classification-on-kuzushiji-mnistResNet-14
Accuracy: 98.75
image-classification-on-mnistResNet-9
Accuracy: 99.68

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CNN滤波器数据库:对训练后卷积滤波器的实证研究 | 论文 | HyperAI超神经