8 个月前

摘要

我们介绍了一种从输入场景图生成图像的方法。该方法将布局嵌入和外观嵌入分开处理。双重嵌入使得生成的图像更好地匹配场景图，具有更高的视觉质量，并支持更复杂的场景图。此外，嵌入方案还支持每个场景图生成多个且多样的输出图像，用户可以进一步控制这些图像。我们展示了两种对象级别的控制模式：(i) 从其他图像中导入元素，以及 (ii) 通过选择一个外观原型在对象空间中导航。我们的代码已公开发布在 https://www.github.com/ashual/scene_generation 上。

源 PDF 查看代码