
摘要
基于重建的检测方法在工业视觉异常检测中得到了广泛应用。这类方法通常要求模型能够良好地重建正常样本,但在面对异常区域时则表现不佳,从而通过评估重建误差来识别异常。然而,在实际应用中,往往难以精确控制模型的泛化边界。若模型泛化能力过强,可能也会对异常区域进行有效重建,导致异常与正常样本难以区分;而若模型泛化能力过弱,则无法准确重建正常区域中变化剧烈的高频成分,进而引发大量误报。为解决上述问题,本文提出一种新型重建网络——EdgRec,该方法从图像的灰度边缘信息中重建原始RGB图像。具体而言,该方法采用带有跳跃连接的UNet型去噪自编码器实现,输入的边缘图与跳跃连接能够有效保留原始图像中的高频信息。同时,所提出的重建任务可促使网络记忆正常图像中的低频结构与颜色特征。此外,去噪设计有效防止了模型直接复制原始图像中的高频成分,提升了重建的语义合理性。为进一步评估异常,我们还设计了一种新的可解释性手工构造评估函数,综合考虑颜色差异与梯度差异。实验结果表明,本方法在具有挑战性的MVTec AD基准测试中取得了优异性能,检测与定位任务的AUROC分别达到97.8%和97.7%。此外,我们在MVTec 3D-AD数据集上进行了实验,仅使用RGB图像即获得了令人信服的结果。相关代码将开源,地址为:https://github.com/liutongkun/EdgRec。
代码仓库
liutongkun/edgrec
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| anomaly-detection-on-mvtec-ad | EdgRec | Detection AUROC: 97.8 Segmentation AUPRO: 92.1 Segmentation AUROC: 97.7 |
| anomaly-detection-on-visa | EdgRec | Detection AUROC: 94.2 Segmentation AUPRO (until 30% FPR): 90.7 |