3 个月前

广义参数化对比学习

广义参数化对比学习

摘要

本文提出了一种广义参数化对比学习方法(Generalized Parametric Contrastive Learning,简称 GPaCo/PaCo),该方法在数据分布均衡与非均衡场景下均表现出色。基于理论分析,我们发现监督对比损失倾向于偏向高频类别,从而加剧了类别不平衡学习的难度。为此,我们引入了一组可学习的类别专属参数化中心,从优化视角实现类别平衡。进一步地,我们在类别均衡设置下对 GPaCo/PaCo 损失函数进行了分析,结果表明:随着同一类样本逐渐被拉近至其对应的中心,该方法能够自适应地增强同类样本间的聚集强度,从而有效促进难样本的学习。在长尾基准数据集上的实验验证了 GPaCo/PaCo 在长尾识别任务中达到了新的最先进性能。在完整 ImageNet 数据集上,无论采用 CNN 还是视觉 Transformer 架构,使用 GPaCo 损失训练的模型均展现出优于 MAE 模型的泛化能力与更强的鲁棒性。此外,GPaCo 方法还可推广至语义分割任务,在当前四个最主流的基准数据集上均取得了显著性能提升。相关代码已开源,地址为:https://github.com/dvlab-research/Parametric-Contrastive-Learning。

代码仓库

dvlab-research/imbalanced-learning
pytorch
GitHub 中提及
dvlab-research/rescom
pytorch
GitHub 中提及

基准测试

基准方法指标
domain-generalization-on-imagenet-cGPaCo (ViT-L)
mean Corruption Error (mCE): 39.0
domain-generalization-on-imagenet-rGPaCo (ViT-L)
Top-1 Error Rate: 39.7
domain-generalization-on-imagenet-sketchGPaCo (ViT-L)
Top-1 accuracy: 48.3
image-classification-on-imagenetGPaCo (ViT-L)
Top 1 Accuracy: 86.01%
image-classification-on-imagenetGPaCo (Vit-B)
Top 1 Accuracy: 84.0%
image-classification-on-imagenetGPaCo (ResNet-50)
Top 1 Accuracy: 79.7%
image-classification-on-inaturalist-2018GPaCo (ResNet-152)
Top-1 Accuracy: 78.1%
image-classification-on-inaturalist-2018GPaCo (ResNet-50)
Top-1 Accuracy: 75.4%
long-tail-learning-on-imagenet-ltGPaCo (2-ResNeXt101-32x4d)
Top-1 Accuracy: 63.2
long-tail-learning-on-inaturalist-2018GPaCo (2-R152)
Top-1 Accuracy: 79.8%
long-tail-learning-on-inaturalist-2018GPaCo (ResNet-50)
Top-1 Accuracy: 75.4%
long-tail-learning-on-inaturalist-2018GPaCo (ResNet-152)
Top-1 Accuracy: 78.1%
long-tail-learning-on-places-ltGPaCo (ResNet-152)
Top-1 Accuracy: 41.7
semantic-segmentation-on-ade20kGPaCo (Swin-L)
Validation mIoU: 54.3
semantic-segmentation-on-pascal-contextGPaCo (ResNet101)
mIoU: 56.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
广义参数化对比学习 | 论文 | HyperAI超神经