3 个月前

分布外检测的极简激活形状设计

分布外检测的极简激活形状设计

摘要

机器学习模型在训练与部署阶段之间的分离,意味着在训练过程中无法预知部署阶段可能遇到的所有场景,因此仅依赖训练阶段的改进存在其局限性。分布外(Out-of-Distribution, OOD)检测是一个关键研究方向,用于检验模型在面对未知情况时的应对能力:模型是否能识别出自己“不知道”的情形?现有的OOD检测方法通常需要额外的训练步骤、引入额外数据,或对已训练网络进行显著修改。相比之下,本文提出一种极为简单、后置式(post-hoc)、实时执行的激活重塑方法——ASH(Activation Shaping at Inference)。该方法在推理阶段对深层特征激活进行处理:移除样本在某一深层中约90%的激活值,仅保留剩余约10%的激活,并对其进行简化或轻微调整。该重塑操作在推理时动态执行,无需依赖训练数据中计算出的任何统计信息。实验结果表明,这种简单的处理方式显著增强了模型对分布内(in-distribution)与分布外样本的区分能力,实现了在ImageNet数据集上的最先进OOD检测性能,同时对分布内准确率几乎不造成明显损害。相关视频、动画及代码已发布于:https://andrijazz.github.io/ash

代码仓库

andrijazz/ash
官方
pytorch
GitHub 中提及
litianliu/fdbd-ood
pytorch
GitHub 中提及

基准测试

基准方法指标
out-of-distribution-detection-on-imagenet-1k-10ASH-S (ResNet-50)
AUROC: 97.6
FPR95: 11.93
out-of-distribution-detection-on-imagenet-1k-12ASH-S (ResNet-50)
AUROC: 95.12
FPR95: 22.8
out-of-distribution-detection-on-imagenet-1k-3ASH-S (ResNet-50)
AUROC: 97.87
FPR95: 11.49
out-of-distribution-detection-on-imagenet-1k-8ASH-S (ResNet-50)
AUROC: 94.02
FPR95: 27.98
out-of-distribution-detection-on-imagenet-1k-9ASH-S (ResNet-50)
AUROC: 90.98
FPR95: 39.78

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
分布外检测的极简激活形状设计 | 论文 | HyperAI超神经