3 个月前

基于类别细粒度微调的局部标签图像多标签分类

基于类别细粒度微调的局部标签图像多标签分类

摘要

图像多标签分类数据集通常为部分标注(即每个样本仅知部分类别上的标签)。一种广泛采用的卷积神经网络训练方法是将所有未知标签视为负标签,该方法被称为“负标签模式”(Negative mode)。然而,这种策略在不同类别上引入了不均衡的错误标签,导致各类别的二分类性能不同程度地下降。相比之下,尽管“忽略模式”(Ignore mode)——即忽略未知标签的贡献——在效果上可能不如负标签模式,但它能确保数据中不引入额外的错误标签,这是负标签模式所缺乏的。本文提出了一种新的后训练方法——类别细调(Category-wise Fine-Tuning, CFT),该方法可应用于通过负标签模式训练得到的模型,以独立提升模型在每个类别上的性能。具体而言,CFT采用忽略模式,逐类别对分类层中的逻辑回归(Logistic Regression, LR)进行微调。通过使用忽略模式,有效缓解了训练阶段因负标签模式引入错误标签所导致的性能下降问题。特别地,CFT在微调逻辑回归时结合了遗传算法(Genetic Algorithm, GA)与二元交叉熵损失函数,以优化模型参数。我们在CheXpert竞赛数据集上评估了所提方法的有效性,结果达到当前文献中的最先进水平(据我们所知)。单个模型提交至竞赛官方评测服务器,在测试集上取得了91.82%的平均AUC(mAUC),为当前排行榜及文献中单模型的最佳成绩。此外,我们的模型集成方案在测试集上实现了93.33%的mAUC(竞赛已结束,我们于测试集发布后在本地机器上进行评估并下载使用)。该结果优于排行榜及文献中的最优水平(93.05%)。同时,我们还在MS-COCO数据集的部分标注版本上进一步验证了所提方法的有效性。

基准测试

基准方法指标
multi-label-classification-on-chexpertCFT (ensemble) Macao Polytechnic University
AVERAGE AUC ON 14 LABEL: 0.933
multi-label-classification-on-chexpertA Good Model (single model) Macao Polytechnic University
AVERAGE AUC ON 14 LABEL: 0.918
NUM RADS BELOW CURVE: 2.600

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于类别细粒度微调的局部标签图像多标签分类 | 论文 | HyperAI超神经