摘要
本文提出DeepSIM,一种基于单张图像的条件图像编辑生成模型。我们发现,充分的数据增强是实现单图像训练的关键,因此引入了薄板样条(Thin-Plate Spline, TPS)作为有效的增强手段。我们的网络学习从图像的原始表征(primitive representation)到真实图像之间的映射关系。原始表征的选择直接影响图像编辑的便捷性与表达能力,其形式可以是自动获取的(如边缘)、人工标注的(如分割图),或二者结合的混合形式(如在分割图基础上叠加边缘信息)。在进行图像编辑时,用户可通过修改原始输入表征,并将其输入网络,从而实现复杂的图像变化。实验结果表明,该方法在各类图像编辑任务中均取得了卓越的性能。
代码仓库
eliahuhorwitz/DeepSIM
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-manipulation-on-lrs2 | Pix2PixHD-SIA | LPIPS (S1): 0.44 LPIPS (S2): 0.47 LPIPS (S3): 0.41 LPIPS (S4): 0.53 LPIPS (S5): 0.46 SIFID (S1): 0.51 SIFID (S2): 0.49 SIFID (S3): 0.5 SIFID (S4): 0.26 SIFID (S5): 0.44 |
| image-manipulation-on-lrs2 | TPS | LPIPS (S1): 0.12 LPIPS (S2): 0.21 LPIPS (S3): 0.1 LPIPS (S4): 0.22 LPIPS (S5): 0.14 SIFID (S1): 0.07 SIFID (S2): 0.12 SIFID (S3): 0.04 SIFID (S4): 0.12 SIFID (S5): 0.06 |