
摘要
我们提出了一种基于条件生成对抗网络(conditional GANs)的新方法,用于从语义标签图合成高分辨率、逼真的图像。尽管条件GANs已广泛应用于各类任务,但其生成结果通常局限于低分辨率,且与真实图像仍有较大差距。在本工作中,我们通过引入一种新型对抗性损失函数,结合全新的多尺度生成器与判别器架构,成功实现了2048×1024分辨率的视觉上极具吸引力的图像生成。此外,我们进一步扩展了该框架,支持交互式视觉编辑,新增两项功能:其一,引入了物体实例分割信息,从而支持删除/添加物体以及更改物体类别等操作;其二,提出一种在相同输入下生成多样化结果的方法,使用户能够交互式地编辑物体外观。人类主观评估实验表明,我们的方法显著优于现有技术,在深度图像合成与编辑的质量和分辨率方面均实现了重要进展。
代码仓库
junzhin/dgm-vlc
pytorch
GitHub 中提及
haru-256/pix2pixHD.pytorch
pytorch
GitHub 中提及
kanhereashwin/cs236-project
pytorch
GitHub 中提及
ayanglab/cs2
pytorch
GitHub 中提及
ubc-vision/DwNet
pytorch
GitHub 中提及
LiuNull/pix2pix_Liu
pytorch
GitHub 中提及
JeongHyunJin/Pix2PixHD
pytorch
GitHub 中提及
wentao99/pix2pixHD
pytorch
GitHub 中提及
NVIDIA/pix2pixHD
官方
pytorch
GitHub 中提及
mingyuliutw/UNIT
pytorch
GitHub 中提及
UdbhavPrasad072300/GANs-Implementations
pytorch
GitHub 中提及
rickyHong/pix2pixHD-repl
pytorch
GitHub 中提及
ayanglab/hdl
pytorch
GitHub 中提及
UBC-Computer-Vision-Group/DwNet
pytorch
GitHub 中提及
SeniorDev009/ONNX-project
pytorch
GitHub 中提及
agermanidis/pix2pixHD-runway
pytorch
GitHub 中提及
moabarar/nemar
pytorch
GitHub 中提及
hwang9u/hum2Guitar
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| fundus-to-angiography-generation-on-fundus | pix2pixHD | FID: 42.8 Kernel Inception Distance: 0.00258 |
| image-to-image-translation-on-ade20k-labels | pix2pixHD | Accuracy: 69.2% FID: 81.8 mIoU: 20.3 |
| image-to-image-translation-on-ade20k-outdoor | pix2pixHD | Accuracy: 71.6% FID: 97.8 mIoU: 17.4 |
| image-to-image-translation-on-cityscapes | pix2pixHD | FID: 95 Per-pixel Accuracy: 81.4% mIoU: 58.3 |
| image-to-image-translation-on-coco-stuff | pix2pixHD | Accuracy: 45.8% FID: 111.5 mIoU: 14.6 |
| sketch-to-image-translation-on-coco-stuff | Pix2PixHD | FID: 38.7 FID-C: 27.1 |