4 个月前

深度残差网络中的恒等映射

深度残差网络中的恒等映射

摘要

深度残差网络作为一种极其深层的架构,展现出了令人信服的准确性和良好的收敛行为。在本文中,我们分析了残差构建块背后的传播公式,这些公式表明,当使用恒等映射作为跳跃连接并在加法之后进行激活时,前向和后向信号可以直接从一个块传播到任何其他块。一系列消融实验支持了这些恒等映射的重要性。这促使我们提出了一种新的残差单元,该单元使得训练更加容易并提高了泛化能力。我们在CIFAR-10(4.62% 错误率)和CIFAR-100数据集上使用了1001层的ResNet,在ImageNet数据集上使用了200层的ResNet,并报告了改进的结果。代码可在以下地址获取:https://github.com/KaimingHe/resnet-1k-layers

代码仓库

TuSimple/resnet.mxnet
tf
GitHub 中提及
umich-vl/DecorrelatedBN
pytorch
GitHub 中提及
P2333/Mixup-Inference
pytorch
GitHub 中提及
rickyHong/JPEG-Defense-repl
tf
GitHub 中提及
smc-x/ms-resnetv2
mindspore
GitHub 中提及
raghakot/keras-resnet
tf
GitHub 中提及
huangleiBuaa/DecorrelatedBN
pytorch
GitHub 中提及
breadboykid/ResnetAgePrediciton
pytorch
GitHub 中提及
poloclub/jpeg-defense
tf
GitHub 中提及
tensorflow/models
tf
GitHub 中提及
edufonseca/icassp19
tf
GitHub 中提及
IMvision12/keras-vision-models
pytorch
GitHub 中提及
iArunava/ResNet
pytorch
GitHub 中提及
yatharthagarwal/x_ray
mxnet
GitHub 中提及
osmr/imgclsmob
mxnet
GitHub 中提及
brain-bzh/MCNN
pytorch
GitHub 中提及
serjtroshin/pytorch-cifar-models
pytorch
GitHub 中提及
statsu1990/ReZero-Cifar100
pytorch
GitHub 中提及
farrell236/ResNetAE
tf
GitHub 中提及
uclaml/Frank-Wolfe-AdvML
tf
GitHub 中提及
KaimingHe/resnet-1k-layers
官方
pytorch
GitHub 中提及
seansoleyman/cifar10-resnet
tf
GitHub 中提及
zjZSTU/ResNet
pytorch
GitHub 中提及
Deci-AI/super-gradients
pytorch
GitHub 中提及
horse007666/ResNet
tf
GitHub 中提及
hysts/pytorch_resnet_preact
pytorch
GitHub 中提及
1M50RRY/resnet18-preact
GitHub 中提及
jofas/master_thesis
tf
GitHub 中提及
Zi-Pan/ResnetAgePrediciton
pytorch
GitHub 中提及
junhocho/SRGAN
GitHub 中提及
Halesu/4th-ML100Days
tf
GitHub 中提及
google-research/diffstride
tf
GitHub 中提及
kaseris/ILSVRCPlus
GitHub 中提及

基准测试

基准方法指标
image-classification-on-cifar-10ResNet-1001
Percentage correct: 95.4
image-classification-on-cifar-100ResNet-1001
Percentage correct: 77.3
image-classification-on-imagenetResNet-200
Top 1 Accuracy: 79.9%
image-classification-on-kuzushiji-mnistPreActResNet-18
Accuracy: 97.82

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度残差网络中的恒等映射 | 论文 | HyperAI超神经