Jim WinkensRudy BunelAbhijit Guha RoyRobert StanforthVivek NatarajanJoseph R. LedsamPatricia MacWilliamsPushmeet KohliAlan KarthikesalingamSimon KohlTaylan CemgilS. M. Ali EslamiOlaf Ronneberger

摘要
可靠地检测分布外(out-of-distribution, OOD)输入,正逐渐被视为机器学习系统部署的前提条件。本文提出并系统研究了一种基于对比学习(contrastive training)的方法,以提升OOD检测性能。与现有主流OOD检测方法不同,本方法无需依赖显式标注为OOD的样本,而这类样本在实际应用中往往难以获取。通过大量实验验证,我们发现对比学习在多个常用基准测试上显著提升了OOD检测的性能。此外,本文引入并应用了“混淆对数概率”(Confusion Log Probability, CLP)评分,该指标通过衡量正常数据与异常数据之间的相似程度,量化了OOD检测任务的难度。实验结果表明,该方法在“近似分布外”(near OOD)类别上表现尤为突出,而这一场景正是以往方法面临重大挑战的典型情形。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| out-of-distribution-detection-on-cifar-100-vs | Joint contrastive and supervised training | AUROC: 78.3 |