4 个月前

CleanNet:用于大规模图像分类器训练的标签噪声迁移学习方法

CleanNet:用于大规模图像分类器训练的标签噪声迁移学习方法

摘要

本文研究了在标签噪声存在的情况下学习图像分类模型的问题。现有的依赖人工监督的方法通常不具备可扩展性,因为手动识别正确或错误的标签耗时较长;而不依赖人工监督的方法虽然具有可扩展性,但效果较差。为了减少标签噪声清理过程中所需的人工监督量,我们引入了CleanNet,一种联合神经嵌入网络,该网络仅需对部分类别进行人工验证即可提供标签噪声的知识,并将其迁移到其他类别中。我们进一步将CleanNet与传统的卷积神经网络分类器整合到一个框架中,用于图像分类的学习。我们在多个大规模数据集上展示了所提出的算法在标签噪声检测任务和基于噪声数据的图像分类任务中的有效性。实验结果表明,与当前的弱监督方法相比,CleanNet可以在没有人工监督的保留类别上将标签噪声检测错误率降低41.5%。此外,在图像分类任务中,仅验证3.2%的图像即可实现验证所有图像性能提升的47%。源代码和数据集将在kuanghuei.github.io/CleanNetProject网站上提供。

代码仓库

YutingLi0606/SURE
pytorch
GitHub 中提及
kuanghuei/clean-net
官方
tf
GitHub 中提及
yingyichen-cyy/JigsawViT
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-clothing1m-usingCleanNet w_soft
Accuracy: 79.90
image-classification-on-food-101n-1CleanNet
Accuracy: 90.39

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CleanNet:用于大规模图像分类器训练的标签噪声迁移学习方法 | 论文 | HyperAI超神经