3 个月前

长尾分类中的特征生成

长尾分类中的特征生成

摘要

视觉世界中的物体或场景实例数量天然存在不平衡,呈现出一种长尾分布(long-tailed distribution)。这种分布对基于深度学习的分类模型构成了重大挑战。尽管通过过采样尾部类别(tail classes)的样本可缓解这一不平衡问题,但受限于视觉多样性不足,往往导致模型的表征能力下降。一种简单的应对策略是将表征网络与分类器网络解耦,并仅使用过采样来训练分类器部分。本文提出了一种新方向:不再重复采样同一图像(从而导致特征重复),而是通过估计尾部类别的分布,生成具有意义的新增特征。受近期少样本学习(few-shot learning)相关思想的启发,我们构建了校准后的类别分布,用于采样额外的特征,进而用于分类器的训练。在具有不同不平衡因子的CIFAR-100-LT(长尾)数据集以及mini-ImageNet-LT(长尾)数据集上的多项实验表明,所提方法具有显著有效性,并达到了新的最先进(state-of-the-art)性能。此外,我们通过t-SNE可视化对生成特征进行了定性分析,并深入研究了用于校准尾部类别分布的最近邻样本。本文代码已开源,地址为:https://github.com/rahulvigneswaran/TailCalibX。

代码仓库

rahulvigneswaran/tailcalibx
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
long-tail-learning-on-cifar-100-lt-r-10CBD+TailCalibX
Error Rate: 38.87
long-tail-learning-on-cifar-100-lt-r-100CBD+TailCalibX
Error Rate: 53.41
long-tail-learning-on-cifar-100-lt-r-50CBD+TailCalibX
Error Rate: 49.1
long-tail-learning-on-mini-imagenet-ltTailCalibX
Error Rate: 55.27

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
长尾分类中的特征生成 | 论文 | HyperAI超神经