4 个月前

从图像中无监督学习3D人脸形状和表情回归

从图像中无监督学习3D人脸形状和表情回归

摘要

从单张图像估计三维人脸形状必须对光照、头部姿态、表情、胡须、化妆和遮挡等因素的变化具有鲁棒性。鲁棒性需要一个包含大量野外图像的大规模训练集,而这些图像本身缺乏真实的三维形状数据。为了在没有任何二维到三维监督的情况下训练网络,我们提出了RingNet,该网络能够从单张图像中学习计算三维人脸形状。我们的关键观察是,无论表情、姿态、光照等因素如何变化,一个人的脸部形状在不同图像中是恒定的。RingNet利用了同一个人的多张图像以及自动检测到的二维面部特征。它采用了一种新颖的损失函数,该损失函数鼓励当身份相同时脸部形状相似,而当身份不同时脸部形状则有所不同。通过使用FLAME模型表示脸部,我们实现了对表情的不变性。训练完成后,我们的方法可以接收单张图像并输出FLAME模型的参数,这些参数可以直接用于动画生成。此外,我们创建了一个新的“接近野外”(Not Quite In-the-Wild, NoW)人脸数据库,其中包含了在各种条件下拍摄的高分辨率图像和3D头部扫描数据。我们评估了公开可用的方法,并发现RingNet比那些使用3D监督的方法更为准确。该数据集、模型和结果已发布供研究使用,网址为http://ringnet.is.tuebingen.mpg.de。

基准测试

基准方法指标
3d-face-reconstruction-on-now-benchmark-1RingNet
Mean Reconstruction Error (mm): 1.53
Median Reconstruction Error: 1.21
Stdev Reconstruction Error (mm): 1.31
3d-face-reconstruction-on-realyRingNet
@cheek: 2.028 (±0.720)
@forehead: 2.995 (±0.908)
@mouth: 2.074 (±0.616)
@nose: 1.934 (±0.458)
all: 2.258
3d-face-reconstruction-on-realy-side-viewRingNet
@cheek: 2.027 (±0.710)
@forehead: 3.081 (±0.950)
@mouth: 1.994 (±0.604)
@nose: 1.921 (±0.451)
all: 2.256
3d-face-reconstruction-on-stirling-hq-fg2018RingNet
Mean Reconstruction Error (mm): 2.02
3d-face-reconstruction-on-stirling-lq-fg2018RingNet
Mean Reconstruction Error (mm): 2.08

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从图像中无监督学习3D人脸形状和表情回归 | 论文 | HyperAI超神经