3 个月前

RSG:一种简单而有效的学习不平衡数据集的模块

RSG:一种简单而有效的学习不平衡数据集的模块

摘要

在实际应用中,类别不平衡数据集广泛存在,这对深度神经网络在罕见类别上的泛化能力构成了重大挑战。本文提出了一种新型的稀有类别样本生成器(Rare-class Sample Generator, RSG),以应对这一问题。RSG旨在训练过程中为稀有类别生成新的样本,具有以下显著优势:(1)使用便捷且高度通用,可轻松集成到各类卷积神经网络中,并在与不同损失函数结合时均能保持良好性能;(2)仅在训练阶段使用,测试阶段无需额外计算,因此不会给深度神经网络带来额外负担。通过大量实验验证,我们充分证明了RSG的有效性。此外,借助RSG,我们在Imbalanced CIFAR数据集上取得了具有竞争力的结果,并在Places-LT、ImageNet-LT和iNaturalist 2018三个基准数据集上达到了新的最先进水平。项目源代码已开源,地址为:https://github.com/Jianf-Wang/RSG。

代码仓库

Jianf-Wang/RSG
官方
pytorch

基准测试

基准方法指标
long-tail-learning-on-cifar-100-lt-r-100LDAM-DRW-RSG
Error Rate: 55.5
long-tail-learning-on-cifar-100-lt-r-50LDAM-DRW-RSG
Error Rate: 51.5
long-tail-learning-on-imagenet-ltLDAM-DRS-RSG
Top-1 Accuracy: 51.8
long-tail-learning-on-inaturalist-2018LDAM-DRS-RSG
Top-1 Accuracy: 70.3%
long-tail-learning-on-places-ltLDAM-DRS-RSG
Top-1 Accuracy: 39.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
RSG:一种简单而有效的学习不平衡数据集的模块 | 论文 | HyperAI超神经