
摘要
我们的研究聚焦于解决一个具有挑战性但极为自然的视觉识别任务——长尾数据分布问题(即少数类别占据绝大部分数据,而绝大多数类别仅包含极少量样本)。在现有文献中,类别重平衡策略(如样本重加权与重采样)是被广泛采用且行之有效的缓解极端数据不平衡问题的方法。本文首次发现,这些重平衡方法之所以能够实现优异的识别准确率,其根本原因在于它们显著促进了深度网络分类器的学习能力。然而,与此同时,这些方法在一定程度上意外损害了所学习深度特征的表征能力。为此,我们提出一种统一的双边分支网络(Bilateral-Branch Network, BBN),旨在同时兼顾表征学习与分类器学习,其中两个分支分别独立承担各自的任务。特别地,我们的BBN模型进一步引入了一种新颖的累积学习策略,该策略旨在先学习通用模式,再逐步聚焦于尾部类别数据。在四个基准数据集(包括大规模的iNaturalist数据集)上的大量实验表明,所提出的BBN方法显著优于当前最先进的技术。此外,验证实验进一步证实了我们初步发现的合理性,并验证了BBN中针对性设计的有效性。我们的方法在iNaturalist 2019大规模物种分类竞赛中荣获第一名,相关代码已开源,可通过 https://github.com/Megvii-Nanjing/BBN 获取。
代码仓库
Megvii-Nanjing/BBN
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| long-tail-learning-on-cifar-10-lt-r-10 | BBN | Error Rate: 11.7 |