4 个月前

使用深度关系网络检测视觉关系

使用深度关系网络检测视觉关系

摘要

物体之间的关系在图像理解中起着至关重要的作用。尽管深度学习技术在识别单个物体方面取得了巨大成功,但对物体之间关系的推理仍然是一个具有挑战性的任务。以往的方法通常将这一问题视为分类问题,将每种类型的关系(例如“骑”)或每个不同的视觉短语(例如“人-骑-马”)视为一个类别。然而,这些方法面临着由于每种关系的高度多样性或不同视觉短语数量庞大而带来的显著困难。我们提出了一种集成框架来解决这一问题。该框架的核心是深关系网络(Deep Relational Network),这是一种专门为利用物体及其关系之间的统计依赖性而设计的新颖结构。在两个大型数据集上,所提出的方法相比现有最佳方法实现了显著的改进。

代码仓库

doubledaibo/drnet
官方
caffe2
GitHub 中提及

基准测试

基准方法指标
visual-relationship-detection-on-vrdDai et. al [[Dai, Zhang, and Lin2017]]
R@100: 81.90
R@50: 80.78
visual-relationship-detection-on-vrd-1Dai et. al [[Dai, Zhang, and Lin2017]]
R@100: 20.88
R@50: 17.73
visual-relationship-detection-on-vrd-phraseDai et. al [[Dai, Zhang, and Lin2017]]
R@100: 23.45
R@50: 19.93

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用深度关系网络检测视觉关系 | 论文 | HyperAI超神经