4 个月前

MultiGrain:一种统一的图像嵌入方法用于类别和实例

MultiGrain:一种统一的图像嵌入方法用于类别和实例

摘要

MultiGrain 是一种网络架构,能够生成适用于图像分类和特定对象检索的紧凑向量表示。该架构基于标准的分类主干网络构建。网络顶部生成的嵌入包含粗粒度和细粒度信息,使得图像可以根据对象类别、特定对象或其是否为失真副本进行识别。我们的联合训练方法非常简单:我们最小化一个用于分类的交叉熵损失以及一个用于确定两幅图像在数据增强范围内是否相同的排序损失,而无需额外的标签。MultiGrain 的关键组件是一个池化层,该层利用高分辨率图像的优势,即使网络是在较低分辨率下训练的。当这些学习到的嵌入被输入线性分类器时,它们提供了最先进的分类准确性。例如,我们在 ImageNet 上使用 ResNet-50 学习到的嵌入达到了 79.4% 的 top-1 准确率,比 AutoAugment 方法绝对提高了 1.8%。在中等分辨率下的图像检索任务中,与余弦相似度相比,这些嵌入的表现与当前最先进方法相当。

代码仓库

leehangyu/MultiGrain_Application
pytorch
GitHub 中提及
facebookresearch/multigrain
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-imagenetMultiGrain PNASNet (450px)
Top 1 Accuracy: 83.2%
image-classification-on-imagenetMultiGrain PNASNet (500px)
Top 1 Accuracy: 83.6%
image-classification-on-imagenetMultiGrain SENet154 (400px)
Top 1 Accuracy: 83.0%
image-classification-on-imagenetMultiGrain R50-AA-500
Top 1 Accuracy: 79.4%
image-classification-on-imagenetMultiGrain SENet154 (450px)
Top 1 Accuracy: 83.1%
image-classification-on-imagenetMultiGrain PNASNet (400px)
Top 1 Accuracy: 82.6%
image-classification-on-imagenetMultiGrain NASNet-A-Mobile (350px)
Top 1 Accuracy: 75.1%
image-classification-on-imagenetMultiGrain R50-AA-224
Top 1 Accuracy: 78.2%
image-classification-on-imagenetMultiGrain PNASNet (300px)
Top 1 Accuracy: 81.3%
image-classification-on-imagenetMultiGrain SENet154 (500px)
Top 1 Accuracy: 82.7%
image-retrieval-on-inria-holidaysMultiGrain R50 @ 800
Mean mAP: 92.5%
image-retrieval-on-inria-holidaysMultiGrain R50 @ 500
Mean mAP: 91.8%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MultiGrain:一种统一的图像嵌入方法用于类别和实例 | 论文 | HyperAI超神经