4 个月前

基于深度对齐聚类发现新意图

基于深度对齐聚类发现新意图

摘要

发现新意图是对话系统中的一个重要任务。现有的大多数方法在将已知意图的先验知识迁移到新意图上时存在局限性,同时在为学习有利于聚类的特征提供高质量监督信号方面也面临困难。本文提出了一种有效的方法——深度对齐聚类(Deep Aligned Clustering),利用有限的已知意图数据来发现新意图。首先,我们利用少量已标记的已知意图样本作为先验知识对模型进行预训练。然后,通过k均值算法生成聚类分配作为伪标签。此外,我们提出了一种对齐策略,以解决聚类分配过程中的标签不一致问题。最后,在对齐后的伪标签监督下学习意图表示。对于未知数量的新意图,我们通过消除低置信度的意图类别簇来预测意图类别的数量。我们在两个基准数据集上进行了广泛的实验,结果表明我们的方法更加稳健,并且相比现有最先进方法取得了显著改进。代码已发布在 https://github.com/thuiar/DeepAligned-Clustering。

代码仓库

hanleizhang/DeepAligned-Clustering
官方
pytorch
GitHub 中提及
thuiar/DeepAligned-Clustering
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
open-intent-discovery-on-banking77DeepAligned
ACC: 64.9
ARI: 0.5364
NMI: 0.7956
open-intent-discovery-on-clinc150DeepAligned
ACC: 86.49
ARI: 0.7975
NMI: 0.9389

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于深度对齐聚类发现新意图 | 论文 | HyperAI超神经