4 个月前

带有Dropouts、Batch Normalization和Skip Connections的MLP泛化

带有Dropouts、Batch Normalization和Skip Connections的MLP泛化

摘要

多层感知器(Multilayer Perceptron, MLP)通常由多个全连接层组成,每个层都配备有非线性激活函数。尽管已经提出了多种方法来改进MLP的性能(例如加快收敛速度、提高收敛极限等),但这些研究缺乏系统性的测试方法。我们通过在年龄和性别数据集上进行实验,测试了不同的MLP架构。实证结果表明,通过对每个线性层之前的输入进行白化处理并添加跳过连接,所提出的MLP架构可以实现更好的性能。由于白化过程包括丢弃操作(Dropout),因此也可以用于近似贝叶斯推理。我们已将代码开源,并在https://github.com/tae898/age-gender/ 上发布了模型和Docker镜像。

代码仓库

tae898/age-gender
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
age-and-gender-classification-on-adienceRetinaFace + ArcFace + MLP + Skip connections
Accuracy (5-fold): 90.66
age-and-gender-classification-on-adience-ageRetinaFace + ArcFace + MLP + IC + Skip connections
Accuracy (5-fold): 60.86

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
带有Dropouts、Batch Normalization和Skip Connections的MLP泛化 | 论文 | HyperAI超神经