3 个月前

用于图像分类的可训练激活函数

用于图像分类的可训练激活函数

摘要

非线性激活函数是深度神经网络架构中的核心组成部分之一。激活函数的选择会显著影响模型的运行速度、性能表现以及收敛能力。目前最常用的激活函数通常不包含可训练参数,且在训练过程中保持不变。本文提出了一系列具有和不具有可训练参数的新型激活函数。这些激活函数各具优缺点。我们将对这些激活函数的性能进行测试,并将其结果与广泛应用的ReLU激活函数进行对比。我们假设,带有可训练参数的激活函数在性能上可能优于无参数版本,因为可训练参数使模型能够“自主选择”每层所采用的激活函数类型。然而,这一优势在很大程度上取决于深度神经网络的具体架构以及激活函数本身的特性。

基准测试

基准方法指标
image-classification-on-cifar-10ResNet-44 (Trainable Activations)
Percentage correct: 90.5
image-classification-on-cifar-10ResNet-56 (Trainable Activations)
Percentage correct: 88.8
image-classification-on-cifar-10ResNet-8 (Trainable Activations)
Percentage correct: 86.5
image-classification-on-cifar-10ResNet-32 (Trainable Activations)
Percentage correct: 90.9
image-classification-on-cifar-10ResNet-14 (Trainable Activations)
Percentage correct: 89.0
image-classification-on-cifar-10ResNet-26 (Trainable Activations)
Percentage correct: 91.1
image-classification-on-cifar-10ResNet-20 (Trainable Activations)
Percentage correct: 90.4
image-classification-on-mnistDNN-3 (Trainable Activations)
Accuracy: 97.0
Percentage error: 3.0
Trainable Parameters: 386719
image-classification-on-mnistDNN-2 (Trainable Activations)
Accuracy: 96.4
Percentage error: 3.6
Trainable Parameters: 311651
image-classification-on-mnistDNN-5 (Trainable Activations)
Accuracy: 97.2
Percentage error: 2.8
Trainable Parameters: 575051

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于图像分类的可训练激活函数 | 论文 | HyperAI超神经