4 个月前

学习语义特定图表示以用于多标签图像识别

学习语义特定图表示以用于多标签图像识别

摘要

识别图像的多个标签是一项实际且具有挑战性的任务,近年来通过搜索语义感知区域和建模标签依赖关系取得了显著进展。然而,当前的方法由于缺乏部件级监督或语义指导,无法准确地定位语义区域。此外,它们无法充分探索语义区域之间的相互作用,并未显式地建模标签共现。为了解决这些问题,我们提出了一种语义特定图表示学习(SSGRL)框架,该框架包含两个关键模块:1)一个语义解耦模块,该模块结合类别语义来引导学习语义特定的表示;2)一个语义交互模块,该模块通过基于统计标签共现构建的图将这些表示相关联,并通过图传播机制探索它们之间的相互作用。在公共基准数据集上的大量实验表明,我们的SSGRL框架在性能上大幅超越了当前最先进的方法,例如在PASCAL VOC 2007和2012、Microsoft-COCO以及Visual Genome基准数据集上分别提高了2.5%、2.6%、6.7%和3.1%的mAP(平均精度均值)。我们的代码和模型可在https://github.com/HCPLab-SYSU/SSGRL 获取。

代码仓库

HCPLab-SYSU/SSGRL
官方
pytorch
GitHub 中提及
ZFT-CQU/DSDL
pytorch
GitHub 中提及

基准测试

基准方法指标
multi-label-classification-on-pascal-voc-2007SSGRL (pretrain from MS-COCO)
mAP: 95.0
multi-label-classification-on-pascal-voc-2007SSGRL (pretrain from ImageNet)
mAP: 93.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
学习语义特定图表示以用于多标签图像识别 | 论文 | HyperAI超神经