
摘要
半监督图像分类是计算机视觉领域中最基础的问题之一,能够显著减少对人工标注的依赖。本文提出了一种新的半监督学习算法——SimMatchV2,该算法从图论视角出发,对有标签数据与无标签数据之间施加多种一致性正则化约束。在SimMatchV2中,我们将样本的增强视图视为图中的一个节点,每个节点包含其标签及其对应的特征表示。不同节点之间通过边相连,边的权重由节点表示之间的相似性度量决定。受图论中消息传递机制与节点分类思想的启发,我们提出了四种一致性形式,分别为:1)节点-节点一致性,2)节点-边一致性,3)边-边一致性,以及4)边-节点一致性。此外,我们发现一种简单的特征归一化操作能够有效缩小不同增强视图之间特征范数的差异,显著提升SimMatchV2的性能。SimMatchV2已在多个半监督学习基准数据集上得到验证。值得注意的是,当采用ResNet-50作为主干网络,并在300个训练周期下进行训练时,SimMatchV2在ImageNet数据集上仅使用1%和10%的标注样本,分别取得了71.9%和76.2%的Top-1准确率,显著优于此前的方法,达到了当前最优水平。代码与预训练模型已公开,获取地址为:https://github.com/mingkai-zheng/SimMatchV2。
代码仓库
kylezheng1997/simmatch
pytorch
GitHub 中提及
mingkai-zheng/simmatchv2
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semi-supervised-image-classification-on-1 | SimMatchV2 (ResNet-50) | Top 1 Accuracy: 71.9% |
| semi-supervised-image-classification-on-2 | SimMatchV2 (ResNet-50) | Top 1 Accuracy: 76.2% |