
摘要
我们提出了一种空间自适应归一化方法,这是一种简单但有效的层,能够在给定输入语义布局的情况下合成逼真的图像。以往的方法直接将语义布局作为输入馈送到深度网络中,然后通过卷积、归一化和非线性层的堆叠进行处理。我们发现这种方法存在不足,因为归一化层往往会“冲淡”语义信息。为了解决这一问题,我们建议使用输入布局通过一种空间自适应且可学习的变换来调节归一化层中的激活值。在多个具有挑战性的数据集上的实验表明,所提出的方法在视觉保真度和与输入布局的对齐方面均优于现有方法。最后,我们的模型允许用户同时控制语义和风格。代码可在 https://github.com/NVlabs/SPADE 获取。
代码仓库
Kokonut133/frame2frame
tf
GitHub 中提及
yeshwanth69/SPADE
pytorch
GitHub 中提及
GrahamRigby/GauGanPlus
pytorch
GitHub 中提及
tinawu-23/smart-sketch
pytorch
GitHub 中提及
noyoshi/smart-sketch
pytorch
GitHub 中提及
Dominioncher/smart-sketch
pytorch
GitHub 中提及
shaoanlu/fewshot-face-translation-GAN
tf
GitHub 中提及
manicman1999/StyleGAN-Keras
GitHub 中提及
tamarott/ASAPNet
pytorch
GitHub 中提及
AhmedAmraniAkdi/BdgetNvidiaGaugan
GitHub 中提及
taki0112/SPADE-Tensorflow
tf
GitHub 中提及
Kokonut133/MagicDraw
tf
GitHub 中提及
NVlabs/SPADE
官方
pytorch
GitHub 中提及
noyoshi/hacksc
pytorch
GitHub 中提及
divyanshj16/SPADE
pytorch
GitHub 中提及
AhmedAmraniAkdi/BudgetNvidiaGaugan
GitHub 中提及
mindslab-ai/hififace
pytorch
GitHub 中提及
AhmedAmraniAkdi/SmallNvidiaGaugan
GitHub 中提及
valeoai/SemanticPalette
pytorch
GitHub 中提及
Cold-Winter/BachGAN
pytorch
GitHub 中提及
LoganOneal/neuralpaint-server
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-to-image-translation-on-ade20k-labels | SPADE | Accuracy: 79.9% FID: 33.9 LPIPS: 0 mIoU: 38.5 |
| image-to-image-translation-on-ade20k-outdoor | SPADE | Accuracy: 82.9% FID: 63.3 mIoU: 30.8 |
| image-to-image-translation-on-cityscapes | SPADE | FID: 71.8 Per-pixel Accuracy: 81.9% mIoU: 62.3 |
| image-to-image-translation-on-coco-stuff | SPADE | Accuracy: 67.9% FID: 22.6 mIoU: 37.4 |
| sketch-to-image-translation-on-coco-stuff | SPADE | FID: 89.2 FID-C: 48.9 |