
摘要
标签噪声与类别不平衡在现实世界数据中常常同时存在。然而,以往针对鲁棒学习的研究通常仅关注其中一种数据偏差,当二者共存时性能显著下降。为弥补这一差距,本文提出一种基于元学习的动态损失函数,能够根据训练过程自动调整目标函数,从而在长尾噪声数据上稳健地学习分类器。具体而言,该动态损失由标签校正器和边界生成器两部分组成:前者用于修正噪声标签,后者则通过感知数据的内在分布及分类器的学习状态,为每一类别生成可加的分类边界。结合一种新型的分层采样策略,该策略通过引入多样且困难的样本,丰富少量无偏的元数据,使动态损失中的两个组件通过元学习联合优化,进而促使分类器更好地适应干净且平衡的测试数据。大量实验表明,该方法在包含多种数据偏差的多个真实世界与合成数据集(如CIFAR-10/100、Animal-10N、ImageNet-LT和Webvision)上均取得了当前最优的分类准确率。代码即将公开。
代码仓库
jiangwenj02/dynamic_loss
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-classification-on-mini-webvision-1-0 | Dynamic Loss (Inception-ResNet-v2) | ImageNet Top-1 Accuracy: 74.76 ImageNet Top-5 Accuracy: 93.08 Top-1 Accuracy: 80.12 Top-5 Accuracy: 93.64 |
| learning-with-noisy-labels-on-animal | Dynamic Loss | Accuracy: 86.5 ImageNet Pretrained: NO Network: Vgg19-BN |