
摘要
在细粒度视觉分类任务中,提取具有判别性的特征起着至关重要的作用。现有的大多数方法主要致力于设计注意力机制或数据增强策略以实现这一目标。然而,对于top-k预测类别中存在的模糊性问题,尚未得到充分研究。本文提出了一种自评估分类器(Self Assessment Classifier),该方法同时利用图像的特征表示以及top-k预测类别,对分类结果进行重新评估。该方法的灵感来源于粗粒度与细粒度分类器协同的持续学习机制,旨在增强主干网络中特征的判别能力,并生成图像中具有信息量区域的注意力图。在实际应用中,该方法作为辅助分支,可轻松集成到多种网络架构中。实验结果表明,通过有效缓解top-k预测类别间的模糊性,我们的方法在CUB200-2011、Stanford Dogs和FGVC Aircraft三个基准数据集上均取得了新的最先进性能。此外,在统一设置下,该方法还能持续提升多种现有细粒度分类器的分类准确率。
代码仓库
aioz-ai/sac
官方
tf
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| fine-grained-image-classification-on-cub-200 | ViT-SAC | Accuracy: 91.8% |
| fine-grained-image-classification-on-fgvc | ViT-SAC | Accuracy: 93.1% |
| fine-grained-image-classification-on-stanford-1 | WS_DAN-SAC | Accuracy: 93.1% |