
摘要
我们提出了一种名为UnMixMatch的半监督学习框架,该框架能够从无约束的未标注数据中学习到有效的特征表示,从而实现性能的可扩展提升。现有的大多数半监督学习方法均依赖于一个关键假设:标注样本与未标注样本来自同一分布,这一假设限制了利用自由获取的未标注数据所带来的性能提升潜力。因此,该假设在很大程度上制约了半监督学习方法的泛化能力与可扩展性。为克服上述局限,本方法旨在有效利用无约束的未标注数据,提升半监督学习的性能。UnMixMatch由三个核心组件构成:一是采用强数据增强策略的监督学习器,提供强有力的正则化;二是对比一致性正则化项,用于从未标注数据中学习深层的潜在表示;三是自监督损失函数,用于进一步增强从未标注数据中学习到的特征表示。我们在4个常用的基准数据集上进行了广泛的实验,结果表明,与现有半监督方法相比,UnMixMatch在性能上实现了显著提升,平均性能提升达4.79%。此外,通过系统的消融实验与敏感性分析,充分验证了所提出各组件的有效性及其对整体性能的贡献。
代码仓库
shuvenduroy/unmixmatch
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-cifar-10-40-labels | UnMixMatch | Accuarcy: 52.07 |
| semi-supervised-image-classification-on-cifar-29 | UnMixMatch | Accuracy: 26.13 |
| semi-supervised-image-classification-on-cifar-30 | UnMixMatch | Accuarcy: 54.18 |
| semi-supervised-image-classification-on-cifar-33 | UnMixMatch | Accuracy: 71.73 |
| semi-supervised-image-classification-on-cifar-34 | UnMixMatch | Accuracy: 68.72 |
| semi-supervised-image-classification-on-cifar-35 | UnMixMatch | Accuracy: 89.58 |
| semi-supervised-image-classification-on-cifar-36 | UnMixMatch | Accuracy: 95.7 |
| semi-supervised-image-classification-on-cifar-37 | UnMixMatch | Accuracy: 96.8 |
| semi-supervised-image-classification-on-cifar-38 | UnMixMatch | Accuracy: 97.2 |
| semi-supervised-image-classification-on-stl-5 | UnMixMatch | Accuracy: 84.73 |
| semi-supervised-image-classification-on-svhn-7 | UnMixMatch | Accuracy: 80.78 |
| semi-supervised-image-classification-on-svhn-8 | UnMixMatch | Accuracy: 72.9 |
| semi-supervised-image-classification-on-svhn-9 | UnMixMatch | Accuracy: 91.03 |