3 个月前

局部类别特定与全局图像级生成对抗网络用于语义引导的场景生成

局部类别特定与全局图像级生成对抗网络用于语义引导的场景生成

摘要

本文研究了语义引导的场景生成任务。场景生成中的一个开放性挑战在于,小物体及局部细节纹理的生成困难,这一问题在现有的全局图像级生成方法中普遍存在。为解决该问题,本文提出在局部上下文中学习场景生成,并相应设计了一种以语义图作为引导的局部类别特定生成网络。该网络通过分别构建并训练专注于不同类别生成的子生成器,能够生成更丰富的场景细节。为进一步提升局部生成任务中类别特定特征表示的判别能力,本文还提出了一种新型分类模块。为融合全局图像级生成与局部类别特定生成的优势,本文设计了一种联合生成网络,其中嵌入了注意力融合模块与双判别器结构。在两个场景图像生成任务上的大量实验表明,所提模型展现出卓越的生成性能,在两项任务及具有挑战性的公开基准上均取得了显著优于现有方法的成果。相关源代码与训练好的模型已公开,地址为:https://github.com/Ha0Tang/LGGAN。

代码仓库

Ha0Tang/LGGAN
官方
pytorch
GitHub 中提及
Ha0Tang/LocalGlobalGAN
pytorch
GitHub 中提及

基准测试

基准方法指标
cross-view-image-to-image-translation-on-2LGGAN
KL: 2.18
PSNR: 22.9949
SD: 19.6145
SSIM: 0.5457
cross-view-image-to-image-translation-on-4LGGAN
KL: 2.55
PSNR: 22.5766
SD: 19.744
SSIM: 0.5238

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
局部类别特定与全局图像级生成对抗网络用于语义引导的场景生成 | 论文 | HyperAI超神经