4 个月前

基于空间自适应归一化的语义图像合成

基于空间自适应归一化的语义图像合成

摘要

我们提出了一种空间自适应归一化方法,这是一种简单但有效的层,能够在给定输入语义布局的情况下合成逼真的图像。以往的方法直接将语义布局作为输入馈送到深度网络中,然后通过卷积、归一化和非线性层的堆叠进行处理。我们发现这种方法存在不足,因为归一化层往往会“冲淡”语义信息。为了解决这一问题,我们建议使用输入布局通过一种空间自适应且可学习的变换来调节归一化层中的激活值。在多个具有挑战性的数据集上的实验表明,所提出的方法在视觉保真度和与输入布局的对齐方面均优于现有方法。最后,我们的模型允许用户同时控制语义和风格。代码可在 https://github.com/NVlabs/SPADE 获取。

代码仓库

Kokonut133/frame2frame
tf
GitHub 中提及
yeshwanth69/SPADE
pytorch
GitHub 中提及
GrahamRigby/GauGanPlus
pytorch
GitHub 中提及
tinawu-23/smart-sketch
pytorch
GitHub 中提及
noyoshi/smart-sketch
pytorch
GitHub 中提及
Dominioncher/smart-sketch
pytorch
GitHub 中提及
tamarott/ASAPNet
pytorch
GitHub 中提及
taki0112/SPADE-Tensorflow
tf
GitHub 中提及
Kokonut133/MagicDraw
tf
GitHub 中提及
NVlabs/SPADE
官方
pytorch
GitHub 中提及
noyoshi/hacksc
pytorch
GitHub 中提及
divyanshj16/SPADE
pytorch
GitHub 中提及
mindslab-ai/hififace
pytorch
GitHub 中提及
valeoai/SemanticPalette
pytorch
GitHub 中提及
Cold-Winter/BachGAN
pytorch
GitHub 中提及
LoganOneal/neuralpaint-server
pytorch
GitHub 中提及

基准测试

基准方法指标
image-to-image-translation-on-ade20k-labelsSPADE
Accuracy: 79.9%
FID: 33.9
LPIPS: 0
mIoU: 38.5
image-to-image-translation-on-ade20k-outdoorSPADE
Accuracy: 82.9%
FID: 63.3
mIoU: 30.8
image-to-image-translation-on-cityscapesSPADE
FID: 71.8
Per-pixel Accuracy: 81.9%
mIoU: 62.3
image-to-image-translation-on-coco-stuffSPADE
Accuracy: 67.9%
FID: 22.6
mIoU: 37.4
sketch-to-image-translation-on-coco-stuffSPADE
FID: 89.2
FID-C: 48.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于空间自适应归一化的语义图像合成 | 论文 | HyperAI超神经