
摘要
多层感知器(Multilayer Perceptron, MLP)通常由多个全连接层组成,每个层都配备有非线性激活函数。尽管已经提出了多种方法来改进MLP的性能(例如加快收敛速度、提高收敛极限等),但这些研究缺乏系统性的测试方法。我们通过在年龄和性别数据集上进行实验,测试了不同的MLP架构。实证结果表明,通过对每个线性层之前的输入进行白化处理并添加跳过连接,所提出的MLP架构可以实现更好的性能。由于白化过程包括丢弃操作(Dropout),因此也可以用于近似贝叶斯推理。我们已将代码开源,并在https://github.com/tae898/age-gender/ 上发布了模型和Docker镜像。
代码仓库
tae898/age-gender
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| age-and-gender-classification-on-adience | RetinaFace + ArcFace + MLP + Skip connections | Accuracy (5-fold): 90.66 |
| age-and-gender-classification-on-adience-age | RetinaFace + ArcFace + MLP + IC + Skip connections | Accuracy (5-fold): 60.86 |