
摘要
监控视频能够捕捉到多种真实的异常行为。在本文中,我们提出通过同时利用正常视频和异常视频来学习异常模式。为避免在训练视频中对异常片段或视频段进行标注——这一过程极为耗时——我们提出采用弱标签训练视频,即训练标签仅在视频级别(视频整体为异常或正常),而非片段级别,结合深度多实例排序框架来学习异常。在我们的方法中,将正常视频与异常视频视为“包”(bags),视频片段视为“实例”(instances),基于多实例学习(MIL)框架,自动学习一个深度异常排序模型,该模型能够为异常视频片段预测较高的异常得分。此外,我们在排序损失函数中引入稀疏性约束和时间平滑性约束,以在训练过程中更精确地定位异常区域。我们还构建了一个全新的、迄今首个大规模监控视频数据集,包含总计128小时的视频内容,涵盖1900段长且未经剪辑的真实世界监控视频,其中包含13种现实中的异常行为(如斗殴、交通事故、入室盗窃、抢劫等)以及正常活动。该数据集可用于两项任务:第一,进行通用异常检测,将所有异常行为归为一类,所有正常活动归为另一类;第二,对13种具体异常行为进行识别。实验结果表明,与现有最先进方法相比,我们提出的MIL异常检测方法在异常检测性能上取得了显著提升。我们还提供了若干近期深度学习基线模型在异常行为识别任务上的实验结果。这些基线模型表现较差的结果表明,我们的数据集具有极高的挑战性,为未来研究提供了广阔的空间。该数据集现已公开,可访问:https://webpages.uncc.edu/cchen62/dataset.html
代码仓库
ShreyasArthur/AbnormalEventDetection
tf
GitHub 中提及
fluque1995/tfm-anomaly-detection
tf
GitHub 中提及
da-head0/cctv-anomaly-detection
GitHub 中提及
erktkdg/MTFL
pytorch
GitHub 中提及
Roc-Ng/DeepMIL
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| abnormal-event-detection-in-video-on-ubi | Sultani et al. | AUC: 0.892 Decidability: 0.804 EER: 0.186 |
| anomaly-detection-in-surveillance-videos-on | Sultani et al. | Decidability: 0.613 EER: 0.353 ROC AUC: 75.41 |
| anomaly-detection-on-ubnormal | MIL | AUC: 50.3% RBDC: 0.002 TBDC: 0.001 |
| semi-supervised-anomaly-detection-on-ubi | Sultani et al. | AUC: 0.787 Decidability: 0.738 EER: 0.294 |
| weakly-supervised-video-anomaly-detection-on | MIL-Rank | AUC-ROC: 85.33 FAR-Normal: 0.15 |
| weakly-supervised-video-anomaly-detection-on-1 | MIL-Rank | AUC-ROC: 54.12 |