
摘要
金融欺诈每年造成数十亿美元的损失。传统上,欺诈检测系统依赖规则机制,因其具备透明性和可解释性,这在需要对决策进行说明的领域中至关重要。然而,规则系统需要领域专家投入大量精力进行构建与调优,而规则归纳算法通过直接从数据中推导规则,试图缓解这一问题。本文探讨了此类算法在欺诈检测中的应用,其中规则系统需满足低误报率(False Positive Rate, FPR)或低警报率的约束。为此,我们提出 RIFF——一种能够直接从决策树中提炼出低误报率规则集的规则归纳算法。实验结果表明,所生成的规则在保持甚至提升原始模型在低误报率任务上性能的同时,显著降低了模型复杂度,并优于由专家手工调优的规则。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| fraud-detection-on-baf-base | FIGS | Recall @ 1% FPR: 21% |
| fraud-detection-on-baf-base | CART | Recall @ 1% FPR: 16% |
| fraud-detection-on-baf-base | FIGU+RIFF | Recall @ 1% FPR: 15.5% |
| fraud-detection-on-baf-base | CART+RIFF | Recall @ 1% FPR: 18.4% |
| fraud-detection-on-baf-base | FIGS+RIFF | Recall @ 1% FPR: 15.8% |
| fraud-detection-on-baf-base | LightGBM | Recall @ 1% FPR: 25.2% |