HyperAIHyperAI

Command Palette

Search for a command to run...

基于迭代消息传递的场景图生成

Danfei Xu Yuke Zhu Christopher B. Choy Li Fei-Fei

摘要

理解视觉场景不仅仅是孤立地识别单个对象。对象之间的关系也构成了关于该场景的丰富语义信息。在本研究中,我们使用场景图(scene graphs)显式建模对象及其关系,这是一种基于图像的图形结构。我们提出了一种新颖的端到端模型,可以从输入图像生成这种结构化的场景表示。该模型利用标准循环神经网络(RNNs)解决场景图推理问题,并通过消息传递机制迭代地改进其预测结果。我们的联合推理模型能够利用上下文线索,从而对对象及其关系做出更准确的预测。实验结果表明,我们的模型在使用Visual Genome数据集生成场景图以及使用NYU Depth v2数据集推断支撑关系方面显著优于先前的方法。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于迭代消息传递的场景图生成 | 论文 | HyperAI超神经