
摘要
分布外(Out-of-Distribution, OOD)检测旨在基于已训练良好的深度模型所提取的特征,识别出分布外数据。然而,现有方法大多忽略了深度模型的可重编程特性,因而未能充分发挥其内在潜力:在不修改模型参数的前提下,仅通过数据层面的调控(例如向输入数据添加特定的特征扰动),即可实现对模型功能的重新配置,使其服务于新任务。这一特性启发我们,将一个原本用于分类的模型重新编程,以在OOD检测这一新任务上表现优异。为此,本文提出了一种通用方法——水印化(watermarking)。具体而言,我们学习一种统一的模式,并将其叠加至原始数据的特征上;经过水印化处理后,模型的OOD检测能力显著提升。大量实验验证了该方法的有效性,充分体现了深度模型可重编程特性在OOD检测中的重要意义。
代码仓库
qizhouwang/watermarking
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| out-of-distribution-detection-on-imagenet-1k-10 | Watermarking (WRN-40-2 w/ MSP) | AUROC: 84.00 FPR95: 61.2 |
| out-of-distribution-detection-on-imagenet-1k-10 | Watermarking (WRN-40-2 w/ Energy) | AUROC: 80.80 FPR95: 67.75 |
| out-of-distribution-detection-on-imagenet-1k-9 | Watermarking (WRN-40-2 w/ Energy) | AUROC: 79.85 FPR95: 71.85 |
| out-of-distribution-detection-on-imagenet-1k-9 | Watermarking (WRN-40-2 w/ MSP) | AUROC: 82.03 FPR95: 70.59 |