4 个月前

基于PixelCNN解码器的条件图像生成

基于PixelCNN解码器的条件图像生成

摘要

这项研究探讨了基于PixelCNN架构的新图像密度模型在条件图像生成中的应用。该模型可以接受任何向量作为条件输入,包括描述性标签或标签,或其他网络生成的潜在嵌入。当以ImageNet数据库中的类别标签为条件时,该模型能够生成多样且逼真的场景,涵盖不同的动物、物体、风景和建筑。当以单张未见过的人脸图像通过卷积网络生成的嵌入为条件时,它能够生成同一人物的各种新肖像,具有不同的面部表情、姿态和光照条件。我们还展示了条件PixelCNN可以作为图像自动编码器中的强大解码器。此外,所提出的模型中引入的门控卷积层提高了PixelCNN的对数似然性,使其在ImageNet上的表现达到了与PixelRNN相当的最先进水平,同时大大降低了计算成本。

基准测试

基准方法指标
density-estimation-on-cifar-10Pixel CNN
NLL (bits/dim): 3.03
image-generation-on-imagenet-32x32Gated PixelCNN
bpd: 3.83
image-generation-on-imagenet-64x64Gated PixelCNN (van den Oord et al., [2016c])
Bits per dim: 3.57

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于PixelCNN解码器的条件图像生成 | 论文 | HyperAI超神经