4 个月前

一种用于领域外意图检测和意图发现的混合架构

一种用于领域外意图检测和意图发现的混合架构

摘要

意图检测是面向任务的对话系统中自然语言理解(NLU)单元的一项任务。超出范围(Out of Scope, OOS)和超出领域(Out of Domain, OOD)的输入可能会给这些系统带来问题。另一方面,训练面向任务的对话系统的意图检测模型需要一个标注数据集。创建标注数据集既耗时又需要人力资源。本文旨在解决上述问题。识别OOD/OOS输入的任务被称为OOD/OOS意图检测。此外,发现新意图并对OOD输入进行伪标注的过程也称为意图发现。在OOD意图检测部分,我们利用变分自编码器(Variational Autoencoder)来区分已知和未知意图,而不依赖于输入数据的分布情况。随后,采用无监督聚类方法来发现OOD/OOS输入背后的各类未知意图。我们还对OOD/OOS表示进行了非线性降维处理,以使表示之间的距离在聚类时更具意义。实验结果表明,所提出的模型在英语和波斯语中均取得了显著的效果,并且超过了基线水平。

代码仓库

基准测试

基准方法指标
intent-discovery-on-atisk-PCA + HDBSCAN
ARI: 74.94
intent-discovery-on-persian-atisk-PCA + HDBSCAN
ARI: 11.97
intent-discovery-on-snipsk-PCA + HDBSCAN
ARI: 59.23
out-of-distribution-ood-detection-on-atisBERT + VAE
F1 - macro: 86.79
out-of-distribution-ood-detection-on-persianBERT + VAE
F1 Macro: 79.03
out-of-distribution-ood-detection-on-snipsBERT + VAE
F1 Macro: 92.32

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于领域外意图检测和意图发现的混合架构 | 论文 | HyperAI超神经