3 个月前

基于深度结构化排序的视觉关系检测

基于深度结构化排序的视觉关系检测

摘要

视觉关系检测旨在描述图像中成对物体之间的交互关系。与单独的物体识别任务不同,可能存在的关系数量显著增多,这使得仅依赖物体的视觉外观进行关系建模变得极为困难。此外,由于人工标注成本较高,视觉关系的标注通常存在不完整性,这进一步增加了模型训练与评估的难度。针对上述挑战,本文提出了一种名为“深度结构排序”(Deep Structural Ranking)的新框架,用于视觉关系检测。为弥补仅依赖视觉外观所带来的表征能力不足,我们融合了多种辅助线索以提升关系预测的准确性。同时,我们设计了一种新的排序目标函数,通过强制标注的关系获得更高的相关性得分,从而增强模型对真实关系的识别能力。与以往方法不同,本方法不仅能有效促进关系之间的共现模式学习,还能缓解标注不完整带来的负面影响。实验结果表明,所提方法在两个广泛使用的基准数据集上均优于当前最先进的技术。此外,我们还验证了该方法在零样本关系检测任务中的优越性能。

基准测试

基准方法指标
visual-relationship-detection-on-vrdvrd-dsr
R@100: 93.18
R@50: 86.01
visual-relationship-detection-on-vrd-1vrd-dsr
R@100: 23.29
R@50: 19.03

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于深度结构化排序的视觉关系检测 | 论文 | HyperAI超神经