
摘要
数据增强是一种有效的技术,用于提高现代图像分类器的准确性。然而,当前的数据增强实现方法都是手动设计的。在本文中,我们描述了一种称为自动增强(AutoAugment)的简单程序,用于自动搜索改进的数据增强策略。在我们的实现中,我们设计了一个搜索空间,其中每个策略由许多子策略组成,每个小批量中的每张图像都会随机选择其中一个子策略进行应用。一个子策略包含两个操作,每个操作是一个图像处理函数(如平移、旋转或错切),以及这些函数被应用的概率和幅度。我们使用一种搜索算法来找到最佳策略,使得神经网络在目标数据集上获得最高的验证准确性。我们的方法在CIFAR-10、CIFAR-100、SVHN和ImageNet(不使用额外数据)上达到了最先进的准确性。在ImageNet上,我们实现了83.5%的Top-1准确率,比之前的记录83.1%提高了0.4%。在CIFAR-10上,我们达到了1.5%的错误率,比之前最先进的结果低了0.6%。我们发现的数据增强策略可以在不同数据集之间迁移。在ImageNet上学到的策略可以很好地迁移到其他数据集上,并取得显著的改进,例如牛津花卉、Caltech-101、牛津-IIT宠物、FGVC航空器和斯坦福汽车数据集。
代码仓库
serfaniane/siamese_person_re_id
tf
GitHub 中提及
ilyak93/GAIN-pytorch
pytorch
GitHub 中提及
abcp4/DAPytorch
pytorch
GitHub 中提及
pytorch/vision
pytorch
LMaxence/Cifar10_Classification
pytorch
GitHub 中提及
TillBeemelmanns/auto-augment-tf2-operations
tf
GitHub 中提及
YaCpotato/B4ResearchDeepaugment
GitHub 中提及
2han9x1a0release/RLCC
pytorch
GitHub 中提及
lyxxn0414/test-data-generation
tf
GitHub 中提及
junkwhinger/fastautoaugment_jsh
pytorch
GitHub 中提及
open-mmlab/mmpretrain
pytorch
GitHub 中提及
YaCpotato/deepaugmentFix
GitHub 中提及
etetteh/sota-data-augmentation-and-optimizers
pytorch
GitHub 中提及
mingsun-tse/good-da-in-kd
pytorch
GitHub 中提及
4uiiurz1/pytorch-auto-augment
pytorch
GitHub 中提及
zhanghang1989/fast-autoaug-torch
pytorch
GitHub 中提及
ofa-sys/chinese-clip
pytorch
GitHub 中提及
northeastsquare/effficientnet
tf
GitHub 中提及
RAF96/ifmo-2019-deep-learning-coursework
GitHub 中提及
QQBrowserVideoSearch/CBVS-UniCLIP
pytorch
GitHub 中提及
barisozmen/deepaugment
GitHub 中提及
hun1204/DeepLearning_Visualization_Basic
tf
GitHub 中提及
DeepVoltaire/AutoAugment
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| data-augmentation-on-imagenet | ResNet-200 (AA) | Accuracy (%): 80.0 |
| data-augmentation-on-imagenet | ResNet-50 (AA) | Accuracy (%): 77.6 |
| domain-generalization-on-vizwiz | EfficientNet-B0 (autoaug) | Accuracy - All Images: 34.9 Accuracy - Clean Images: 40.1 Accuracy - Corrupted Images: 27.3 |
| domain-generalization-on-vizwiz | EfficientNet-B1 (autoaug) | Accuracy - All Images: 39.7 Accuracy - Clean Images: 44.4 Accuracy - Corrupted Images: 32.8 |
| domain-generalization-on-vizwiz | EfficientNet-B2 (autoaug) | Accuracy - All Images: 41.6 Accuracy - Clean Images: 45.8 Accuracy - Corrupted Images: 34.3 |
| domain-generalization-on-vizwiz | EfficientNet-B3 (autoaug) | Accuracy - All Images: 42.6 Accuracy - Clean Images: 47.5 Accuracy - Corrupted Images: 34.9 |
| fine-grained-image-classification-on-caltech | AutoAugment | Top-1 Error Rate: 13.07% |
| fine-grained-image-classification-on-fgvc | AutoAugment | Accuracy: 92.67% Top-1 Error Rate: 7.33 |
| fine-grained-image-classification-on-oxford | AutoAugment | Accuracy: 95.36% Top-1 Error Rate: 4.64% |
| fine-grained-image-classification-on-oxford-1 | AutoAugment | Accuracy: 88.98% Top-1 Error Rate: 11.02% |
| fine-grained-image-classification-on-stanford | AutoAugment | Accuracy: 94.8% |
| image-classification-on-cifar-100 | PyramidNet+ShakeDrop | Percentage correct: 89.3 |