3 个月前

超越合成噪声:基于受控噪声标签的深度学习

超越合成噪声:基于受控噪声标签的深度学习

摘要

在噪声数据上开展受控实验对于理解深度学习在不同噪声水平下的表现至关重要。由于缺乏合适的基准数据集,以往研究仅限于在受控的合成标签噪声环境下考察深度学习模型,而真实世界中的标签噪声始终未能在受控条件下进行系统研究。本文作出三项主要贡献。首先,我们首次构建了来自网络的受控真实世界标签噪声基准数据集。该新基准使我们能够首次在受控环境下系统研究网络标签噪声的特性。其次,我们提出了一种简单但高效的方法,可有效应对合成噪声标签与真实噪声标签。实验表明,该方法在我们自建数据集上以及两个公开基准数据集(CIFAR 和 WebVision)上均取得了最优性能。第三,我们开展了迄今为止规模最大的研究,深入探讨了深度神经网络在不同噪声水平、噪声类型、网络架构及训练设置下,基于噪声标签训练的表现。相关数据与代码已公开发布,访问链接为:http://www.lujiang.info/cnlw.html。

基准测试

基准方法指标
image-classification-on-mini-webvision-1-0MentorMix (Inception-ResNet-v2)
ImageNet Top-1 Accuracy: 72.9
ImageNet Top-5 Accuracy: 91.1
Top-1 Accuracy: 76.0
Top-5 Accuracy: 90.2
image-classification-on-webvision-1000MentorMix (InceptionResNet-V2)
ImageNet Top-1 Accuracy: 67.5%
ImageNet Top-5 Accuracy: 87.2%
Top-1 Accuracy: 74.3%
Top-5 Accuracy: 90.5%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
超越合成噪声:基于受控噪声标签的深度学习 | 论文 | HyperAI超神经