
摘要
近年来,人脸检测受到了广泛的关注。许多研究从模型架构、数据增强、标签分配等多个角度提出了多种专门的方法,使得整体算法和系统变得越来越复杂。在本文中,我们指出人脸检测与通用目标检测之间不存在差距。随后,我们提供了一种强大而简单的基线方法来处理人脸检测,命名为TinaFace。我们使用ResNet-50 \cite{he2016deep} 作为主干网络,并且TinaFace中的所有模块和技术都是基于现有的模块构建的,易于实现,并基于通用目标检测。在最流行和最具挑战性的人脸检测基准WIDER FACE \cite{yang2016wider} 的困难测试集上,使用单模型和单尺度时,我们的TinaFace达到了92.1%的平均精度(AP),超过了大多数使用更大主干网络的近期人脸检测器。而在使用测试时间增强(TTA)之后,我们的TinaFace超越了当前最先进的方法,达到了92.4%的AP。代码将在 \url{https://github.com/Media-Smart/vedadet} 上公开。参考文献:- He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR).- Yang, Y., Li, Z., Luo, Y., Wang, X., & Qiao, Y. (2016). WIDER FACE: A Face Detection Benchmark. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).
代码仓库
基准测试
| 基准 | 方法 | 指标 | 
|---|---|---|
| occluded-face-detection-on-wider-face-easy | TinaFace(ResNet-50) | AP: 0.97 | 
| occluded-face-detection-on-wider-face-hard | TinaFace(ResNet-50) | AP: 0.934 | 
| occluded-face-detection-on-wider-face-medium | TinaFace(ResNet-50) | AP: 0.963 |