3 个月前

Puzzle Mix:利用显著性与局部统计信息实现最优Mixup

Puzzle Mix:利用显著性与局部统计信息实现最优Mixup

摘要

尽管深度神经网络在拟合训练数据分布方面表现出色,但其所学习的模型容易出现过拟合现象,且对对抗攻击较为敏感。为此,近期提出了一系列基于Mixup的数据增强方法。然而,这些方法主要致力于生成此前未见过的虚拟样本,有时反而会向网络提供误导性的监督信号。针对这一问题,我们提出了Puzzle Mix,一种能够显式利用自然样本显著性信息及其底层统计特性的Mixup方法。该方法引出了一个有趣的优化问题,其交替优化过程包含两个部分:一是针对最优混合掩码的多标签目标函数,二是基于显著性加权的最优传输目标函数。实验结果表明,在CIFAR-100、Tiny-ImageNet和ImageNet等数据集上,Puzzle Mix在泛化性能与对抗鲁棒性方面均优于现有的其他Mixup方法,达到了当前最优水平。项目源代码已公开,地址为:https://github.com/snu-mllab/PuzzleMix。

代码仓库

snu-mllab/PuzzleMix
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-cifar-100WRN28-10
Percentage correct: 84.05
image-classification-on-imagenetResNet-50
Hardware Burden:
Operations per network pass:
Top 1 Accuracy: 78.76%
image-classification-on-tiny-imagenet-2PreActResNet18
Top 1 Accuracy: 63.48
semantic-segmentation-on-acdc-scribblesPuzzle Mix
Dice (Average): 62.4%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Puzzle Mix:利用显著性与局部统计信息实现最优Mixup | 论文 | HyperAI超神经