3 个月前

我的朋友们帮我一点:基于最近邻对比学习的视觉表征

我的朋友们帮我一点:基于最近邻对比学习的视觉表征

摘要

基于实例判别的自监督学习算法通过训练编码器,使其对同一实例的预定义变换保持不变性。尽管大多数方法将同一图像的不同视图视为对比损失中的正样本,我们则关注利用数据集中其他实例的样本作为正样本。我们提出的方法——最近邻对比学习视觉表征(Nearest-Neighbor Contrastive Learning of visual Representations, NNCLR),在隐空间中从数据集中采样最近邻作为正样本。相比预定义的变换,这种方法能够引入更丰富的语义变化。我们发现,在对比损失中使用最近邻作为正样本可显著提升ImageNet分类性能,准确率从71.7%提升至75.6%,超越了此前的最先进方法。在半监督学习基准测试中,当仅使用1%的ImageNet标签时,性能也显著提升,准确率由53.8%提高至56.5%。在迁移学习基准测试中,我们的方法在12个下游数据集中的8个上优于当前最先进的方法(包括使用ImageNet进行监督学习的方法)。此外,我们通过实证表明,该方法对复杂数据增强的依赖程度更低:在仅使用随机裁剪进行训练的情况下,ImageNet Top-1准确率仅下降2.1%,表现出更强的鲁棒性。

基准测试

基准方法指标
fine-grained-image-classification-on-birdsnapNNCLR
Accuracy: 61.4%
fine-grained-image-classification-on-caltechNNCLR
Top-1 Error Rate: 8.7%
fine-grained-image-classification-on-fgvcNNCLR
Accuracy: 64.1
fine-grained-image-classification-on-sun397NNCLR
Accuracy: 62.5
image-classification-on-cifar-10NNCLR
Percentage correct: 93.7
image-classification-on-cifar-100NNCLR
Percentage correct: 79
image-classification-on-dtdNNCLR
Accuracy: 75.5
image-classification-on-flowers-102NNCLR
Accuracy: 95.1
image-classification-on-food-101-1NNCLR
Accuracy (%): 76.7
image-classification-on-oxford-iiit-petsNNCLR
Accuracy: 91.8
image-classification-on-pascal-voc-2007NNCLR
Accuracy: 83
image-classification-on-stanford-carsNNCLR
Accuracy: 67.1
self-supervised-image-classification-onNNCLR (ResNet-50, multi-crop)
Number of Params: 25M
Top 1 Accuracy: 75.6%
Top 5 Accuracy: 92.4
semi-supervised-image-classification-on-1NNCLR (ResNet-50)
Top 1 Accuracy: 56.4%
Top 5 Accuracy: 80.7
semi-supervised-image-classification-on-2NNCLR (ResNet-50)
Top 1 Accuracy: 69.8%
Top 5 Accuracy: 89.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
我的朋友们帮我一点:基于最近邻对比学习的视觉表征 | 论文 | HyperAI超神经