4 个月前

二值化卷积地标定位器在有限资源下的人体姿态估计和面部对齐

二值化卷积地标定位器在有限资源下的人体姿态估计和面部对齐

摘要

我们的目标是设计一种架构,该架构在保留卷积神经网络(CNN)在地标定位任务中的开创性性能的同时,具有轻量级、紧凑的特点,并适用于计算资源有限的应用场景。为此,我们做出了以下贡献:(a) 我们首次研究了神经网络二值化对定位任务的影响,特别是人体姿态估计和面部对齐。我们全面评估了各种设计选择,识别了性能瓶颈,并且更重要的是提出了多种正交的方法来提升性能。(b) 基于我们的分析,我们提出了一种新颖的分层、并行和多尺度残差架构,该架构在参数数量相同的情况下显著提高了标准瓶颈块的性能,从而弥合了原始网络与其二值化版本之间的差距。(c) 我们进行了大量的消融研究,揭示了所提出的模块的特性和性能。(d) 我们展示了在最具挑战性的人体姿态估计和面部对齐数据集上的实验结果,在许多情况下报告了最先进的性能。代码可以从 https://www.adrianbulat.com/binary-cnn-landmarks 下载。

基准测试

基准方法指标
face-alignment-on-aflw-full-1Binary Face Alignment
Mean NME : 2.85

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
二值化卷积地标定位器在有限资源下的人体姿态估计和面部对齐 | 论文 | HyperAI超神经