3 个月前

一种两阶段预测感知的对比学习框架用于多意图自然语言理解

一种两阶段预测感知的对比学习框架用于多意图自然语言理解

摘要

多意图自然语言理解(Multi-intent Natural Language Understanding, NLU)面临严峻挑战,主要源于单个语句中存在多个意图时模型产生的混淆问题。尽管以往的研究通过对比学习方式训练模型以增大不同多意图标签之间的间隔,但这类方法在处理多意图NLU的细微差异方面仍显不足。它们忽略了共享意图之间的丰富信息,而这些信息对于构建更优的嵌入空间具有重要意义,尤其是在低数据场景下。为此,本文提出一种两阶段预测感知对比学习(Prediction-Aware Contrastive Learning, PACL)框架,以充分挖掘这一宝贵知识。我们的方法通过融合词级别预训练与预测感知的对比微调,有效利用共享意图信息。具体而言,我们采用词级别数据增强策略构建预训练数据集;随后,在对比微调阶段,框架动态为样本分配角色,并引入预测感知对比损失函数,以最大化对比学习的效能。我们在三个广泛使用的基准数据集上进行了实验与实证分析,结果表明,所提方法在低数据和全数据两种场景下均显著优于三种主流基线模型,展现出优异的性能与鲁棒性。

基准测试

基准方法指标
intent-detection-on-mixatisTFMN (PACL)
Accuracy: 82.9
intent-detection-on-mixatisRoBERTa (PACL)
Accuracy: 79.1
intent-detection-on-mixatisSLIM (PACL)
Accuracy: 81.9
intent-detection-on-mixsnipsRoBERTa (PACL)
Accuracy: 96.5
intent-detection-on-mixsnipsSLIM (PACL)
Accuracy: 96.9
intent-detection-on-mixsnipsTFMN (PACL)
Accuracy: 97.4
slot-filling-on-mixatisTFMN (PACL)
Micro F1: 86.7
slot-filling-on-mixatisRoBERTa (PACL)
Micro F1: 86.0
slot-filling-on-mixatisSLIM (PACL)
Micro F1: 87.3
slot-filling-on-mixsnipsRoBERTa (PACL)
Micro F1: 96.2
slot-filling-on-mixsnipsTFMN (PACL)
Micro F1: 96.3
slot-filling-on-mixsnipsSLIM (PACL)
Micro F1: 96.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种两阶段预测感知的对比学习框架用于多意图自然语言理解 | 论文 | HyperAI超神经