
摘要
MultiGrain 是一种网络架构,能够生成适用于图像分类和特定对象检索的紧凑向量表示。该架构基于标准的分类主干网络构建。网络顶部生成的嵌入包含粗粒度和细粒度信息,使得图像可以根据对象类别、特定对象或其是否为失真副本进行识别。我们的联合训练方法非常简单:我们最小化一个用于分类的交叉熵损失以及一个用于确定两幅图像在数据增强范围内是否相同的排序损失,而无需额外的标签。MultiGrain 的关键组件是一个池化层,该层利用高分辨率图像的优势,即使网络是在较低分辨率下训练的。当这些学习到的嵌入被输入线性分类器时,它们提供了最先进的分类准确性。例如,我们在 ImageNet 上使用 ResNet-50 学习到的嵌入达到了 79.4% 的 top-1 准确率,比 AutoAugment 方法绝对提高了 1.8%。在中等分辨率下的图像检索任务中,与余弦相似度相比,这些嵌入的表现与当前最先进方法相当。
代码仓库
2023-MindSpore-1/ms-code-62
mindspore
leehangyu/MultiGrain_Application
pytorch
GitHub 中提及
facebookresearch/multigrain
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-imagenet | MultiGrain PNASNet (450px) | Top 1 Accuracy: 83.2% |
| image-classification-on-imagenet | MultiGrain PNASNet (500px) | Top 1 Accuracy: 83.6% |
| image-classification-on-imagenet | MultiGrain SENet154 (400px) | Top 1 Accuracy: 83.0% |
| image-classification-on-imagenet | MultiGrain R50-AA-500 | Top 1 Accuracy: 79.4% |
| image-classification-on-imagenet | MultiGrain SENet154 (450px) | Top 1 Accuracy: 83.1% |
| image-classification-on-imagenet | MultiGrain PNASNet (400px) | Top 1 Accuracy: 82.6% |
| image-classification-on-imagenet | MultiGrain NASNet-A-Mobile (350px) | Top 1 Accuracy: 75.1% |
| image-classification-on-imagenet | MultiGrain R50-AA-224 | Top 1 Accuracy: 78.2% |
| image-classification-on-imagenet | MultiGrain PNASNet (300px) | Top 1 Accuracy: 81.3% |
| image-classification-on-imagenet | MultiGrain SENet154 (500px) | Top 1 Accuracy: 82.7% |
| image-retrieval-on-inria-holidays | MultiGrain R50 @ 800 | Mean mAP: 92.5% |
| image-retrieval-on-inria-holidays | MultiGrain R50 @ 500 | Mean mAP: 91.8% |