
摘要
区域丢弃策略已被提出以增强卷积神经网络分类器的性能。这些策略已被证明在引导模型关注物体的非关键部分(例如人的腿部而非头部)方面非常有效,从而使网络具有更好的泛化能力和目标定位能力。然而,当前的区域丢弃方法通过叠加黑色像素块或随机噪声来移除训练图像中的信息像素,这种移除方式并不理想,因为它会导致信息丢失并降低训练效率。因此,我们提出了CutMix数据增强策略:在训练图像之间切割和粘贴图像块,同时根据图像块的面积比例混合真实标签。通过高效利用训练像素并保留区域丢弃的正则化效果,CutMix在CIFAR和ImageNet分类任务以及ImageNet弱监督定位任务中始终优于最先进的数据增强策略。此外,与以往的数据增强方法不同,我们的CutMix训练的ImageNet分类器作为预训练模型时,在Pascal检测和MS-COCO图像描述基准测试中也表现出一致的性能提升。我们还展示了CutMix提高了模型对输入损坏的鲁棒性和其在分布外检测方面的性能。源代码和预训练模型可在https://github.com/clovaai/CutMix-PyTorch 获取。
代码仓库
Kaushal28/CutMix-Regularization-using-PyTorch
pytorch
GitHub 中提及
kornia/kornia
pytorch
hysts/pytorch_cutmix
pytorch
GitHub 中提及
airplane2230/keras_cutmix
tf
GitHub 中提及
pytorch/vision
pytorch
rwightman/pytorch-image-models
pytorch
GitHub 中提及
kboseong/RotNet
pytorch
GitHub 中提及
Bennie-Han/Image-augementation-pytorch
pytorch
GitHub 中提及
xden2331/attentive_cutmix
pytorch
GitHub 中提及
sangHa0411/ImageNet
pytorch
GitHub 中提及
Westlake-AI/openmixup
pytorch
GitHub 中提及
PaddlePaddle/PaddleClas
paddle
toshi-k/kaggle-bengaliai-handwritten-grapheme-classification
pytorch
GitHub 中提及
ildoonet/cutmix
pytorch
GitHub 中提及
jis478/cutmix_tensorflow2
tf
GitHub 中提及
clovaai/CutMix-PyTorch
官方
pytorch
GitHub 中提及
TianshuXie/Cut-Thumbnail
pytorch
GitHub 中提及
liuch37/image-processing
pytorch
GitHub 中提及
SyogoShibuya/Chainer-Cutmix
GitHub 中提及
open-mmlab/mmclassification
pytorch
sangHa0411/VIT
pytorch
GitHub 中提及
dongdong69/MixAugmentation
GitHub 中提及
PsorTheDoctor/microarray-data
tf
GitHub 中提及
IlyaDobrynin/GridMixup
pytorch
GitHub 中提及
hh-xiaohu/Image-augementation-pytorch
pytorch
GitHub 中提及
js-aguiar/wheat-object-detection
pytorch
GitHub 中提及
juergenlandauer/Maya-Challenge
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 | 
|---|---|---|
| domain-generalization-on-imagenet-a | CutMix (ResNet-50) | Top-1 accuracy %: 7.3 | 
| image-captioning-on-coco | NIC (ResNet-50, CutMix) | BLEU-1: 64.2 BLEU-2: 46.3 BLEU-3: 33.6 BLEU-4: 24.9 CIDEr: 77.6 METEOR: 23.1 ROUGE: 49 | 
| image-classification-on-cifar-10 | PyramidNet-200 + CutMix | Percentage correct: 97.12 | 
| image-classification-on-cifar-100 | PyramidNet-200 + Shakedrop + Cutmix | Percentage correct: 86.19 | 
| image-classification-on-imagenet | ResNet-50 (CutMix) | Top 1 Accuracy: 78.4% | 
| image-classification-on-imagenet | ResNeXt-101 (CutMix) | Top 1 Accuracy: 80.53% | 
| image-classification-on-omnibenchmark | CutMix | Average Top-1 Accuracy: 31.1 | 
| semantic-segmentation-on-acdc-scribbles | CutMix | Dice (Average): 70.5% |