
摘要
视频中的异常事件检测是一个具有挑战性的视觉问题。由于训练过程中异常数据的稀缺,大多数现有方法将异常事件检测视为离群点检测任务。由于缺乏关于异常事件的先验信息,这些方法在区分正常和异常事件方面并不完全具备能力。在这项工作中,我们将异常事件检测形式化为一个一对多(one-versus-rest)的二分类问题。我们的贡献有两方面:首先,我们引入了一种基于对象中心卷积自编码器的无监督特征学习框架,用于编码运动和外观信息;其次,我们提出了一种基于将训练样本聚类为正常簇的监督分类方法。然后,使用一对多异常事件分类器将每个正常簇与其他簇分开。为了训练分类器,其他簇充当虚拟异常。在推理阶段,如果一对多分类器分配的最高分类分数为负值,则该对象被标记为异常。我们在四个基准数据集上进行了全面实验:Avenue、ShanghaiTech、UCSD 和 UMN。我们的方法在这四个数据集上均提供了优越的结果。特别是在大规模的 ShanghaiTech 数据集上,我们的方法在帧级 AUC 指标上相比最先进的方法 [Sultani 等人, CVPR 2018] 提高了 8.4% 的绝对增益。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| anomaly-detection-on-chuk-avenue | Object-centric AE | AUC: 87.4% RBDC: 15.77 TBDC: 27.01 |
| anomaly-detection-on-shanghaitech | Object-centric AE | AUC: 78.7% |