
摘要
在系统监控、医疗健康和网络安全等多个领域,时间序列数据中的异常检测具有重要意义。尽管现有方法众多,使得针对特定应用场景选择最适宜的方法变得困难,但每种方法在检测特定类型异常方面均具备其独特优势。本研究对比了六种复杂度各异的无监督异常检测方法,旨在探究更复杂的方法是否通常表现更优,以及某些方法是否对特定类型的异常更具适应性。我们采用UCR异常数据集(UCR Anomaly Archive)这一近期异常检测领域的基准数据集对各方法进行评估,并在对每种方法调整必要超参数后,从数据集和异常类型两个层面分析其性能表现。此外,我们还评估了各方法融合先验异常知识的能力,并比较了点级特征与序列级特征之间的差异。实验结果表明,在多种异常类型下,传统机器学习方法的整体表现普遍优于深度学习方法。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| anomaly-detection-on-ucr-anomaly-archive | Autoencoder (AE) | AUC ROC : 0.58 ±0.01 Average F1: 0.16 ± 0.013 |
| anomaly-detection-on-ucr-anomaly-archive | Robust Random Cut Forest (RRCF) | AUC ROC : 0.56 ± 0.0019 Average F1: 0.07 ±0.011 |
| anomaly-detection-on-ucr-anomaly-archive | Graph Augmented Normalizing Flows (GANF) | AUC ROC : 0.63 ±0.009 Average F1: 0.23 ±0.021 |
| anomaly-detection-on-ucr-anomaly-archive | MERLIN | AUC ROC : 0.51 ± 0.0 Average F1: 0.27 ±0.0 |
| anomaly-detection-on-ucr-anomaly-archive | Maximally Divergent Intervals (MDI) | AUC ROC : 0.66 ± 0.0 Average F1: 0.25 ±0.0 |
| anomaly-detection-on-ucr-anomaly-archive | Transformer Network for Anomaly Detection (TranAD) | AUC ROC : 0.56 ±0.003 Average F1: 0.18 ±0.003 |