3 个月前

用于全连接层(FC layers)的ProgressiveSpinalNet架构

用于全连接层(FC layers)的ProgressiveSpinalNet架构

摘要

在深度学习模型中,全连接(Fully Connected, FC)层在基于前层所学特征对输入进行分类方面扮演着至关重要的角色。FC层通常包含最多的参数,而对这些大量参数进行微调会消耗绝大部分计算资源。因此,本文旨在显著减少FC层的参数数量,同时提升模型性能。该研究的灵感来源于SpinalNet及其他生物结构。所提出的网络架构在输入层与输出层之间构建了一条梯度高速公路,有效缓解了深度网络中的梯度消失问题。在此架构中,每一层不仅接收前序层的输出,还直接接收卷积神经网络(CNN)层的特征输出,从而使得所有层均能参与最终决策过程,增强了信息流动与表征能力。该方法在分类性能上优于原始SpinalNet架构,并在多个数据集(包括Caltech101、KMNIST、QMNIST和EMNIST)上达到了当前最优(SOTA)水平。项目源代码已公开,可访问:https://github.com/praveenchopra/ProgressiveSpinalNet。

代码仓库

基准测试

基准方法指标
fine-grained-image-classification-on-1VGG-5
Accuracy: 98.98
fine-grained-image-classification-on-bird-225Pre trained wide-resnet-101
Accuracy: 99.55
fine-grained-image-classification-on-caltechPre trained wide-resnet-101
Accuracy: 97.76
fine-grained-image-classification-on-emnistVGG-5
Accuracy: 99.82
fine-grained-image-classification-on-emnist-1VGG-5
Accuracy: 95.86
fine-grained-image-classification-on-fruitsPre trained wide-resnet-101
Accuracy: 99.97
fine-grained-image-classification-on-mnistVanilla FC layer only
Accuracy: 98.19
fine-grained-image-classification-on-qmnistVGG-5
Accuracy: 99.6867
fine-grained-image-classification-on-stl-10Pre trained wide-resnet-101
Accuracy: 98.18

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于全连接层(FC layers)的ProgressiveSpinalNet架构 | 论文 | HyperAI超神经