
摘要
我们重新审视了长期存在的小样本学习问题,并为此提出了一种称为GLICO(Generative Latent Implicit Conditional Optimization)的新方法。GLICO从训练样例中学习到一个映射至潜在空间的过程,并生成一个可以从该潜在空间中的向量生成图像的生成器。与大多数依赖大量未标记数据的最新研究不同,GLICO除了少量已标记的数据点外,不需要任何额外的数据。实际上,GLICO可以利用每个类别仅5或10个样例,以及少至10个这样的类别,在不施加任何先验的情况下,学会为每个类别合成全新的样本。随后,GLICO在训练分类器时用于扩充小规模训练集。为此,我们提出的方法通过球面插值对所学的潜在空间进行采样,并使用训练好的生成器生成新的样例。实证结果表明,新采样的集合具有足够的多样性,从而在CIFAR-10、CIFAR-100和CUB-200数据集中获取的小样本上训练时,图像分类性能相比现有最先进技术有所提升。
代码仓库
IdanAzuri/glico-learning-small-sample
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| small-data-image-classification-on-cifar-10 | GLICO | Accuracy (%): 56.22 |
| small-data-image-classification-on-cifar-10-1 | GLICO | Top-1 accuracy %: 43 |
| small-data-on-cifar-100-1000-labels-1 | GLICO | Accuracy: 28.55 |
| small-data-on-cub-200-2011-30-samples-per-1 | GLICO | Accuracy: 77.75 |
| small-data-on-cub-200-2011-5-samples-per-1 | GLICO | Accuracy: 51.52 |