7 个月前

摘要

数据增强是一种有效的技术，用于提高现代图像分类器的准确性。然而，当前的数据增强实现方法都是手动设计的。在本文中，我们描述了一种称为自动增强（AutoAugment）的简单程序，用于自动搜索改进的数据增强策略。在我们的实现中，我们设计了一个搜索空间，其中每个策略由许多子策略组成，每个小批量中的每张图像都会随机选择其中一个子策略进行应用。一个子策略包含两个操作，每个操作是一个图像处理函数（如平移、旋转或错切），以及这些函数被应用的概率和幅度。我们使用一种搜索算法来找到最佳策略，使得神经网络在目标数据集上获得最高的验证准确性。我们的方法在CIFAR-10、CIFAR-100、SVHN和ImageNet（不使用额外数据）上达到了最先进的准确性。在ImageNet上，我们实现了83.5%的Top-1准确率，比之前的记录83.1%提高了0.4%。在CIFAR-10上，我们达到了1.5%的错误率，比之前最先进的结果低了0.6%。我们发现的数据增强策略可以在不同数据集之间迁移。在ImageNet上学到的策略可以很好地迁移到其他数据集上，并取得显著的改进，例如牛津花卉、Caltech-101、牛津-IIT宠物、FGVC航空器和斯坦福汽车数据集。

源 PDF