3 个月前

基于类别感知选择性损失的局部标注多标签分类

基于类别感知选择性损失的局部标注多标签分类

摘要

大规模多标签分类数据集通常且不可避免地存在部分标注问题,即每个样本仅标注了少量标签。不同的缺失标签处理方法会赋予模型不同的特性,并显著影响其分类准确率。本文针对这一部分标注问题展开分析,并提出一种基于两个核心思想的解决方案。首先,对于未标注的标签,应根据两个概率量进行选择性处理:一是整个数据集中各类别的整体分布,二是特定样本对某一标签的预测可能性。我们提出利用一个专用的临时模型来估计类别分布,并证明该方法相较于仅依赖数据集部分标注信息进行的朴素估计,具有更高的效率与准确性。其次,在目标模型的训练过程中,我们引入一种专门设计的非对称损失函数,以强化已标注标签的贡献,同时弱化原始未标注标签的影响,从而提升模型对真实标签的识别能力。基于上述新方法,我们在 OpenImages 数据集上取得了当前最优的性能表现(例如在 V6 版本上达到 87.3 mAP)。此外,在 LVIS 和模拟 COCO 数据集上的实验进一步验证了该方法的有效性。相关代码已开源,地址为:https://github.com/Alibaba-MIIL/PartialLabelingCSL。

代码仓库

alibaba-miil/partiallabelingcsl
官方
pytorch
GitHub 中提及

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于类别感知选择性损失的局部标注多标签分类 | 论文 | HyperAI超神经