4 个月前

面向十亿规模的半监督图像分类学习

面向十亿规模的半监督图像分类学习

摘要

本文介绍了一项关于使用大型卷积网络进行半监督学习的研究。我们提出了一种基于教师/学生范式的流水线方法,该方法利用了大量未标记图像(最多可达10亿张)。我们的主要目标是提高特定目标架构的性能,例如ResNet-50或ResNeXt。我们对本方法的成功因素进行了详尽分析,并据此提出了一些建议,以生成高精度的模型用于图像分类的半监督学习。结果表明,我们的方法在图像、视频和细粒度分类的标准架构上带来了显著的性能提升。例如,通过利用10亿张未标记图像,我们训练的普通ResNet-50在ImageNet基准测试中达到了81.2%的Top-1准确率。

代码仓库

基准测试

基准方法指标
image-classification-on-imagenetResNeXt-101 32x16d (semi-weakly sup.)
Number of params: 193M
Top 1 Accuracy: 84.8%
image-classification-on-imagenetResNeXt-101 32x4d (semi-weakly sup.)
Number of params: 42M
Top 1 Accuracy: 83.4%
image-classification-on-imagenetResNeXt-101 32x8d (semi-weakly sup.)
Number of params: 88M
Top 1 Accuracy: 84.3%
image-classification-on-omnibenchmarkIG-1B
Average Top-1 Accuracy: 40.4
object-recognition-on-shape-biasSWSL (ResNet-50)
shape bias: 28.6
object-recognition-on-shape-biasSWSL (ResNeXt-101)
shape bias: 49.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向十亿规模的半监督图像分类学习 | 论文 | HyperAI超神经