
摘要
在非受限条件下获取的人脸图像中,自动预测年龄组和性别是一项重要且具有挑战性的任务,广泛应用于诸多实际场景。然而,传统方法在野外基准数据集上依赖人工设计的特征,由于难以应对非受限图像中巨大的变化,性能往往不尽如人意。卷积神经网络(CNN)凭借其强大的特征表示能力,在一定程度上缓解了这一难题。本文提出一种基于新型CNN架构的年龄组与性别估计方法,该方法引入残差网络的残差网络(Residual Networks of Residual Networks, RoR),相较于其他CNN架构,在年龄组与性别分类任务中展现出更优的优化能力。此外,本文还基于年龄组特征的观察,提出了两种简洁有效的机制,进一步提升了年龄估计的性能。为更好地提升模型表现并缓解过拟合问题,我们首先在ImageNet数据集上对RoR模型进行预训练,随后在IMDB-WIKI-101数据集上进行微调,以进一步学习人脸图像的特征表示,最后在Adience数据集上进行最终微调。实验结果表明,所提出的RoR方法在野外场景下的年龄与性别估计任务中具有显著有效性,性能优于其他主流CNN方法。最终,结合两种机制的RoR-152+IMDB-WIKI-101模型在Adience基准测试中取得了新的最先进(state-of-the-art)性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| age-and-gender-classification-on-adience-age | RoR-34 + IMDB-WIKI | Accuracy (5-fold): 66.74 |