4 个月前

一种用于野外面部图像年龄和性别分类的混合Transformer-Sequencer方法

一种用于野外面部图像年龄和性别分类的混合Transformer-Sequencer方法

摘要

计算机视觉和图像处理技术的进步已经催生了视觉监控、定向广告、基于内容的搜索和人机交互等领域的新应用。在计算机视觉的各种技术中,面部分析尤其受到了广泛关注。以往的多项研究尝试探索面部特征处理在多种任务中的不同应用,包括年龄和性别分类。然而,尽管已有许多研究探讨了这一问题,但在野外条件下的人脸年龄和性别分类仍然远未达到实际应用所需的精度水平。因此,本文提出了一种结合自注意力机制(self-attention)和双向长短期记忆网络(BiLSTM)的混合模型,以解决年龄和性别分类问题。该模型的性能与目前提出的多个最先进模型进行了比较。结果表明,所提出的模型在年龄分类任务上比现有最先进实现提高了约10%,在性别分类任务上提高了约6%。因此,该模型被发现具有优越的性能,并且提供了更广泛的泛化学习能力。该模型可以作为核心分类组件应用于各种图像处理和计算机视觉问题中。

基准测试

基准方法指标
age-and-gender-classification-on-adienceViT-hSeq
Accuracy (5-fold): 96.56
age-and-gender-classification-on-adience-ageViT-hSeq
Accuracy (5-fold): 84.91

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于野外面部图像年龄和性别分类的混合Transformer-Sequencer方法 | 论文 | HyperAI超神经