3 个月前

WILDCAT:用于图像分类、逐点定位与分割的弱监督深度ConvNet学习

WILDCAT:用于图像分类、逐点定位与分割的弱监督深度ConvNet学习

摘要

本文提出了一种名为WILDCAT的深度学习方法,该方法旨在联合实现图像区域的对齐以获得空间不变性,同时学习高度局部化的特征。我们的模型仅使用全局图像标签进行训练,专注于三大主要视觉识别任务:图像分类、弱监督目标定位以及语义分割。WILDCAT在三个关键层面扩展了当前最先进的卷积神经网络(Convolutional Neural Networks):一是采用全卷积网络(Fully Convolutional Networks)以保持空间分辨率;二是显式地在网络结构中设计与不同类别模态相关的局部特征;三是提出一种新的特征池化方式,用于生成弱监督训练所需的全局图像预测。大量实验结果表明,该模型在性能上显著优于现有最先进方法。

基准测试

基准方法指标
weakly-supervised-object-detection-on-cocoWILDCAT
MAP: 53.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
WILDCAT:用于图像分类、逐点定位与分割的弱监督深度ConvNet学习 | 论文 | HyperAI超神经