
摘要
这项研究探讨了基于PixelCNN架构的新图像密度模型在条件图像生成中的应用。该模型可以接受任何向量作为条件输入,包括描述性标签或标签,或其他网络生成的潜在嵌入。当以ImageNet数据库中的类别标签为条件时,该模型能够生成多样且逼真的场景,涵盖不同的动物、物体、风景和建筑。当以单张未见过的人脸图像通过卷积网络生成的嵌入为条件时,它能够生成同一人物的各种新肖像,具有不同的面部表情、姿态和光照条件。我们还展示了条件PixelCNN可以作为图像自动编码器中的强大解码器。此外,所提出的模型中引入的门控卷积层提高了PixelCNN的对数似然性,使其在ImageNet上的表现达到了与PixelRNN相当的最先进水平,同时大大降低了计算成本。
代码仓库
eyalbetzalel/pytorch-generative-v2
pytorch
GitHub 中提及
SJHNJU/Gated_PixelCNN
tf
GitHub 中提及
anordertoreclaim/PixelCNN
pytorch
GitHub 中提及
kkleidal/gatedpixelcnnpytorch
pytorch
GitHub 中提及
eyalbetzalel/pytorch-generative
pytorch
GitHub 中提及
chandlersupple/Tensorflow-PixelCNN
tf
GitHub 中提及
kamenbliznashki/pixel_models
pytorch
GitHub 中提及
openai/pixel-cnn
tf
GitHub 中提及
SJHNJU/gated-pixelcnn
tf
GitHub 中提及
rampage644/wavenet
tf
GitHub 中提及
PsorTheDoctor/microarray-data
tf
GitHub 中提及
vocong25/gated_pixelcnn
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| density-estimation-on-cifar-10 | Pixel CNN | NLL (bits/dim): 3.03 |
| image-generation-on-imagenet-32x32 | Gated PixelCNN | bpd: 3.83 |
| image-generation-on-imagenet-64x64 | Gated PixelCNN (van den Oord et al., [2016c]) | Bits per dim: 3.57 |