4 个月前

神经聚合网络用于视频人脸识别

神经聚合网络用于视频人脸识别

摘要

本文介绍了一种用于视频人脸识别的神经聚合网络(Neural Aggregation Network, NAN)。该网络以包含可变数量人脸图像的面部视频或面部图像集作为输入,生成一个紧凑且固定维度的特征表示用于识别。整个网络由两个模块组成。特征嵌入模块是一个深度卷积神经网络(Convolutional Neural Network, CNN),它将每张人脸图像映射到一个特征向量。聚合模块包含两个注意力块,这些注意力块自适应地聚合特征向量,形成一个位于它们所张成的凸包内的单一特征。由于采用了注意力机制,聚合过程对图像顺序具有不变性。我们的NAN在训练时使用标准分类或验证损失函数,无需任何额外的监督信号,我们发现它能够自动学习选择高质量的人脸图像,同时排斥低质量的图像,如模糊、遮挡和曝光不当的人脸图像。在IJB-A、YouTube Face和Celebrity-1000视频人脸识别基准上的实验表明,该方法始终优于简单的聚合方法,并达到了最先进的准确率。

基准测试

基准方法指标
face-identification-on-dronesurfNAN (Adaface)
Rank1: 80.21
face-verification-on-bts3-1MCN (Arcface)
TAR @ FAR=0.01: 0.3941
face-verification-on-bts3-1NAN (Adaface)
TAR @ FAR=0.01: 0.5444
face-verification-on-bts3-1NAN (Arcface)
TAR @ FAR=0.01: 0.3901
face-verification-on-ijb-aNAN
TAR @ FAR=0.01: 94.10%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
神经聚合网络用于视频人脸识别 | 论文 | HyperAI超神经