4 个月前

流形混合:通过插值隐藏状态获得更好的表示

流形混合:通过插值隐藏状态获得更好的表示

摘要

深度神经网络在学习训练数据方面表现出色,但在评估略有不同的测试样本时,往往会产生错误且自信的预测。这包括分布偏移、异常值和对抗性样本。为了解决这些问题,我们提出了一种简单的正则化方法——流形混合(Manifold Mixup),该方法鼓励神经网络对隐藏表示的插值进行更加谨慎的预测。流形混合利用语义插值作为额外的训练信号,从而获得在多个表示层次上具有更平滑决策边界的神经网络。因此,使用流形混合训练的神经网络在学习类别表示时减少了方差方向的数量。我们在理想条件下证明了这种平坦化的理论依据,并在实际情况下进行了验证,同时将其与信息论和泛化方面的先前工作联系起来。尽管流形混合不会显著增加计算量,并且只需几行代码即可实现,但它在监督学习、对单步对抗攻击的鲁棒性和测试对数似然性方面均提升了强大的基线模型性能。

代码仓库

chris-tng/semi-supervised-nlp
pytorch
GitHub 中提及
yhu01/PT-MAP
pytorch
GitHub 中提及
Westlake-AI/openmixup
pytorch
GitHub 中提及
allenhaozhu/ease
pytorch
GitHub 中提及
makeyourownmaker/mixup
pytorch
GitHub 中提及
erichson/noisy_mixup
pytorch
GitHub 中提及
DaikiTanak/manifold_mixup
pytorch
GitHub 中提及
vikasverma1077/manifold_mixup
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-classification-on-cifar-10Manifold Mixup WRN 28-10
Percentage correct: 97.45
image-classification-on-cifar-100Manifold Mixup
Percentage correct: 81.96
image-classification-on-omnibenchmarkManifold
Average Top-1 Accuracy: 31.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
流形混合:通过插值隐藏状态获得更好的表示 | 论文 | HyperAI超神经