
摘要
在本研究中,我们将视频异常检测任务表述为对物体边界框的概率分析。我们假设仅通过物体的边界框表示,就足以成功识别场景中的异常事件。这种方法的潜在价值在于增强物体匿名化、加快模型训练速度以及减少计算资源需求。这特别有利于在边缘设备(如摄像头)上运行的视频监控应用。我们基于人类推理设计了模型,这有助于以人类可理解的方式解释模型输出。同时,最慢的模型在第11代英特尔酷睿i9处理器上训练时间不到7秒。尽管我们的方法相比现有技术大幅减少了问题特征空间,但我们展示了这并不会导致性能下降:我们在CUHK Avenue和ShanghaiTech基准数据集上的结果具有很高的竞争力,并且在StreetScene数据集上的最新状态(State-of-the-Art)结果显著超越了此前的最佳表现,而StreetScene一直被认为是最具挑战性的视频异常检测数据集。
代码仓库
milestonesys-research/vad-with-pgms
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| anomaly-detection-on-chuk-avenue | PGM | AUC: 92.72% RBDC: 60.18 TBDC: 72.09 |
| anomaly-detection-on-shanghaitech | PGM | AUC: 61.28% RBDC: 45.40 TBDC: 81.87 |
| anomaly-detection-on-street-scene | PGM | AUC: 72.7 RBDC: 30.65 TBDC: 66.03 |
| video-anomaly-detection-on-cuhk-avenue | PGM | AUC: 92.72% RBDC: 60.18 TBDC: 72.09 |
| video-anomaly-detection-on-shanghaitech-4 | PGM | AUC: 61.28% RBDC: 45.4 TBDC: 81.87 |
| video-anomaly-detection-on-street-scene | PGM | AUC: 72.7 RBDC: 30.65 TBDC: 66.03 |