3 个月前

长尾数据集中的多标签分类分布均衡损失

长尾数据集中的多标签分类分布均衡损失

摘要

我们提出了一种名为分布平衡损失(Distribution-Balanced Loss)的新损失函数,用于解决具有长尾类别分布的多标签识别问题。相较于传统的单标签分类任务,多标签识别问题通常更具挑战性,主要源于两个关键问题:标签共现现象以及在将多标签问题转化为多个二分类任务时负标签的主导性。为应对上述挑战,分布平衡损失对标准的二元交叉熵损失进行了两项关键改进:1)提出一种新的权重重平衡机制,能够有效考虑标签共现带来的影响;2)引入负样本容忍正则化项,以缓解负标签被过度抑制的问题。在Pascal VOC和COCO数据集上的实验结果表明,采用该损失函数训练的模型在性能上显著优于现有方法。代码与预训练模型已开源,获取地址为:https://github.com/wutong16/DistributionBalancedLoss。

代码仓库

wutong16/DistributionBalancedLoss
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
long-tail-learning-on-coco-mltDB Focal(ResNet-50)
Average mAP: 53.55
long-tail-learning-on-voc-mltDB Focal(ResNet-50)
Average mAP: 78.94

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
长尾数据集中的多标签分类分布均衡损失 | 论文 | HyperAI超神经