3 个月前

大规模自监督模型是强大的半监督学习者

大规模自监督模型是强大的半监督学习者

摘要

一种在仅使用少量标注样本的同时充分利用大量未标注数据进行学习的范式,是无监督预训练结合有监督微调。尽管该范式以任务无关的方式利用未标注数据,与计算机视觉领域常见的半监督学习方法不同,我们发现其在ImageNet上的半监督学习任务中表现出令人惊讶的高效性。我们方法的关键在于:在预训练和微调阶段均采用大规模(深度与宽度均较大)的网络结构。我们发现,标注数据越少,该方法(即任务无关地利用未标注数据)就越能从更大规模的网络中获益。在完成微调后,可通过第二次以任务相关的方式利用未标注样本,对大网络进行进一步优化并将其知识蒸馏为一个显著更小的模型,同时几乎不损失分类准确率。所提出的半监督学习算法可概括为三个步骤:首先,使用SimCLRv2对大型ResNet模型进行无监督预训练;其次,在少量标注样本上进行有监督微调;最后,利用未标注样本进行知识蒸馏,以精炼并迁移任务相关的知识。该方法仅使用1%的标注数据(每类不超过13张标注图像),便在ResNet-50上实现了73.9%的ImageNet Top-1准确率,相较于此前最先进的方法,标签使用效率提升了10倍。当使用10%的标注数据时,采用本方法训练的ResNet-50达到77.5%的Top-1准确率,显著优于使用全部标注数据的标准有监督训练。

代码仓库

google-research/simclr
官方
tf
GitHub 中提及
sayakpaul/PAWS-TF
tf
GitHub 中提及
serre-lab/prj_selfsup
tf
GitHub 中提及
ta9ryuWalrus/simclr
tf
GitHub 中提及
parkinkon1/simclr
tf
GitHub 中提及
nikheelpandey/TAUP
pytorch
GitHub 中提及
nikheelpandey/TAUP-PyTorch
pytorch
GitHub 中提及

基准测试

基准方法指标
self-supervised-image-classification-onSimCLRv2 (ResNet-50 x2)
Number of Params: 94M
Top 1 Accuracy: 75.6%
Top 5 Accuracy: 92.7%
self-supervised-image-classification-onSimCLRv2 (ResNet-50)
Number of Params: 24M
Top 1 Accuracy: 71.7%
Top 5 Accuracy: 90.4%
self-supervised-image-classification-onSimCLRv2 (ResNet-152 x3, SK)
Number of Params: 795M
Top 1 Accuracy: 79.8%
Top 5 Accuracy: 94.9%
self-supervised-image-classification-on-1SimCLRv2 (ResNet-152, 3×+SK)
Number of Params: 795M
Top 1 Accuracy: 83.1%
semi-supervised-image-classification-on-1SimCLRv2 (ResNet-152 x3, SK)
Top 1 Accuracy: 74.9%
Top 5 Accuracy: 92.3%
semi-supervised-image-classification-on-1SimCLRv2 distilled (ResNet-50 x2, SK)
Top 1 Accuracy: 75.9%
Top 5 Accuracy: 93.0%
semi-supervised-image-classification-on-1SimCLRv2 distilled (ResNet-50)
Top 1 Accuracy: 73.9%
Top 5 Accuracy: 91.5%
semi-supervised-image-classification-on-1SimCLRv2 self-distilled (ResNet-152 x3, SK)
Top 1 Accuracy: 76.6%
Top 5 Accuracy: 93.4%
semi-supervised-image-classification-on-1SimCLRv2 (ResNet-50)
Top 1 Accuracy: 57.9%
Top 5 Accuracy: 82.5%
semi-supervised-image-classification-on-1SimCLRv2 (ResNet-50 ×2)
Top 1 Accuracy: 66.3%
Top 5 Accuracy: 87.4%
semi-supervised-image-classification-on-2SimCLRv2 (ResNet-152 x3, SK)
Top 1 Accuracy: 80.1%
Top 5 Accuracy: 95.0%
semi-supervised-image-classification-on-2SimCLRv2 (ResNet-50)
Top 1 Accuracy: 68.4%
Top 5 Accuracy: 89.2%
semi-supervised-image-classification-on-2SimCLRv2 distilled (ResNet-50 x2, SK)
Top 1 Accuracy: 80.2%
Top 5 Accuracy: 95.0%
semi-supervised-image-classification-on-2SimCLRv2 distilled (ResNet-50)
Top 1 Accuracy: 77.5%
Top 5 Accuracy: 93.4%
semi-supervised-image-classification-on-2SimCLRv2 (ResNet-50 x2)
Top 1 Accuracy: 73.9%
Top 5 Accuracy: 91.9%
semi-supervised-image-classification-on-2SimCLRv2 self-distilled (ResNet-152 x3, SK)
Top 1 Accuracy: 80.9%
Top 5 Accuracy: 95.5%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
大规模自监督模型是强大的半监督学习者 | 论文 | HyperAI超神经