4 个月前

GENESIS:基于对象中心潜在表示的生成场景推理与采样

GENESIS:基于对象中心潜在表示的生成场景推理与采样

摘要

生成潜在变量模型正在成为机器人技术和强化学习领域的有前途工具。然而,尽管这些领域的任务通常涉及不同的对象,大多数最先进的生成模型并未明确捕捉视觉场景的组合性质。两个最近的例外是MONet和IODINE,它们以无监督的方式将场景分解为对象。然而,它们的基本生成过程并未考虑组件之间的相互作用。因此,这两种方法都无法实现对新场景的原理性采样。本文介绍GENESIS,这是首个能够通过捕捉场景组件之间关系来同时分解和生成3D视觉场景的对象中心生成模型。GENESIS在图像上参数化了一个空间高斯混合模型(GMM),该模型从一组对象中心的潜在变量中解码而来,这些潜在变量可以以摊销的方式顺序推断,也可以从自回归先验中采样。我们在多个公开可用的数据集上训练了GENESIS,并对其在场景生成、分解和半监督学习方面的性能进行了评估。

代码仓库

jinyangyuan/genesis
pytorch
GitHub 中提及
applied-ai-lab/genesis
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-generation-on-gqnGENESIS
FID: 80.5
image-generation-on-multi-dspritesGENESIS
FID: 24.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GENESIS:基于对象中心潜在表示的生成场景推理与采样 | 论文 | HyperAI超神经