4 个月前

面向对抗攻击的深度学习模型

面向对抗攻击的深度学习模型

摘要

近期的研究表明,深度神经网络容易受到对抗样本的攻击——这些输入几乎无法与自然数据区分开来,但却被网络错误分类。实际上,最新的研究结果表明,对抗攻击的存在可能是深度学习模型固有的弱点。为了解决这一问题,我们通过鲁棒优化的视角研究了神经网络的对抗鲁棒性。这种方法为我们提供了一个广泛且统一的观点,涵盖了先前关于该主题的大量工作。其原则性还使我们能够识别出训练和攻击神经网络的方法,这些方法既可靠又在某种意义上具有普遍性。特别是,它们指定了一个具体的防御保障,可以抵御任何对手。这些方法使我们能够训练出对广泛范围内的对抗攻击具有显著增强抵抗力的网络。此外,它们还提出了针对一阶对手(first-order adversary)的安全保障作为自然且广泛的防御保障。我们认为,对这种明确定义的对手类别的鲁棒性是实现完全抗攻击的深度学习模型的重要一步。相关代码和预训练模型可在 https://github.com/MadryLab/mnist_challenge 和 https://github.com/MadryLab/cifar10_challenge 获取。

代码仓库

Hadisalman/robust-verify-benchmark
pytorch
GitHub 中提及
KnowledgeDiscovery/FaceSec
pytorch
GitHub 中提及
ucsb-nlp-chang/textgrad
pytorch
GitHub 中提及
cdluminate/advrank-pub
pytorch
GitHub 中提及
amerch/CIFAR100-Training
pytorch
GitHub 中提及
cdluminate/advrank
pytorch
GitHub 中提及
jokeryan/post_training
pytorch
GitHub 中提及
locuslab/convex_adversarial
pytorch
GitHub 中提及
scenarri/s2m-tea
pytorch
GitHub 中提及
arobey1/mbrdl
pytorch
GitHub 中提及
loes5307/vocaladversary2022
pytorch
GitHub 中提及
EPFL-VILAB/XDEnsembles
pytorch
GitHub 中提及
locuslab/robust_overfitting
pytorch
GitHub 中提及
peck94/cann-detector
tf
GitHub 中提及
VishaalMK/VectorDefense
tf
GitHub 中提及
luizgh/adversarial_signatures
pytorch
GitHub 中提及
MadryLab/cifar10_challenge
官方
tf
GitHub 中提及
bethgelab/cifar10_challenge
tf
GitHub 中提及
eldadp100/cnn_course_final
pytorch
GitHub 中提及
revbucket/mister_ed
pytorch
GitHub 中提及
MadryLab/mnist_challenge
官方
tf
GitHub 中提及
openai/cleverhans
tf
GitHub 中提及
boyellow/adaad
pytorch
GitHub 中提及
hrdwsong/TDLMR2AA-Paddle
paddle
GitHub 中提及
khieu/cifar10_challenge
tf
GitHub 中提及
bingcheng45/hnr-extension
tf
GitHub 中提及
val-iisc/flss
pytorch
GitHub 中提及
cleverhans-lab/cleverhans
tf
GitHub 中提及
abahram77/mnist_challenge
tf
GitHub 中提及
cs-giung/course-dl-TP
pytorch
GitHub 中提及
tensorflow/cleverhans
tf
GitHub 中提及
matanbt/attack-tabular
GitHub 中提及
microsoft/distance-learner
pytorch
GitHub 中提及
zibojia/rslad
pytorch
GitHub 中提及
abahram77/mnistChallenge
tf
GitHub 中提及
arobey1/advbench
pytorch
GitHub 中提及
henry8527/GCE
pytorch
GitHub 中提及

基准测试

基准方法指标
adversarial-attack-on-cifar-10AdvTraining [madry2018]
Attack: PGD20: 48.440
part-of-speech-tagging-on-morphosyntacticMyBert
BLEX: 77.21

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供