
摘要
本文的目标是实现人脸识别——无论是基于单张照片,还是基于视频中追踪到的一组人脸。该领域近年来的进展主要归功于两个因素:(i)采用卷积神经网络(CNN)进行端到端的任务学习;(ii)大规模训练数据集的可用性。本文做出两项贡献:首先,我们展示了如何通过自动化与人工参与相结合的方式,构建一个规模庞大的数据集(包含260万张图像,涉及超过2600名人员),并探讨了数据纯净度与采集时间之间的权衡;其次,我们深入分析了深度网络训练与人脸识别中的复杂性,提出了一系列方法与流程,能够在标准的LFW和YTF人脸识别基准测试中达到与当前最先进水平相当的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-recognition-on-casia-webface-masks | VGG-Face | Accuracy: 79.65 |
| face-recognition-on-celeba-masks | VGG-Face | Accuracy: 84.56 |
| face-verification-on-labeled-faces-in-the | VGG-Face | Accuracy: 98.78% |
| face-verification-on-youtube-faces-db | VGG-Face | Accuracy: 97.40% |