
摘要
识别对话系统中从未在训练集中出现过的未知(新颖)用户意图是一项具有挑战性的任务。本文提出了一种两阶段方法来检测未知意图。我们使用带有边缘损失的双向长短期记忆(BiLSTM)网络作为特征提取器。通过边缘损失,我们可以迫使网络最大化类间差异并最小化类内差异,从而学习到具有区分性的深层特征。然后,我们将特征向量输入基于密度的新颖性检测算法——局部离群因子(LOF),以检测未知意图。在两个基准数据集上的实验表明,与基线方法相比,我们的方法可以实现一致的性能提升。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| open-intent-detection-on-atis-25-known | LMCL | F1: 0.696 |
| open-intent-detection-on-atis-50-known | LMCL | F1: 0.396 |
| open-intent-detection-on-snips-25-known | LMCL | F1: 0.792 |
| open-intent-detection-on-snips-50-known | LMCL | F1: 0.841 |
| open-intent-detection-on-snips-75-known | LMCL | F1: 0.788 |