3 个月前

一种用于数字抠图的晚期融合CNN

一种用于数字抠图的晚期融合CNN

摘要

本文研究了一种深度卷积神经网络的结构,旨在仅以单张RGB图像为输入,预测前景的alpha蒙版。所提出的网络为全卷积结构,包含两个解码分支,分别用于前景和背景的分类。随后,通过一个融合分支将两个分类结果进行整合,生成具有软分割特性的alpha值。该设计为网络在训练过程中获得更优的alpha值提供了更高的自由度。与仅使用单一解码分支的方法相比,该架构能够隐式地生成trimap,无需用户交互,因而对缺乏数字抠像专业知识的初学者而言具有良好的易用性。实验结果表明,该网络能够为各类物体生成高质量的alpha蒙版,并在人像抠像任务中优于当前最先进的基于CNN的图像抠像方法。

基准测试

基准方法指标
image-matting-on-aim-500LF
Conn.: 181.26
Grad.: 63.51
MAD: 0.1130
MSE: 0.0667
SAD: 191.74
image-matting-on-am-2kLF
MAD: 0.0210
MSE: 0.0116
SAD: 36.12
image-matting-on-p3m-10kLF
MAD: 0.0250
MSE: 0.0191
SAD: 42.95

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于数字抠图的晚期融合CNN | 论文 | HyperAI超神经