
摘要
多意图识别与槽位填充联合模型因其更贴近复杂的现实应用场景而日益受到关注。然而,现有方法存在以下两方面问题:(1)仅关注话语与任务中独热编码标签之间的隐式关联,忽视了标签本身的显式特征;(2)直接将每个词元的多意图信息进行融合,可能导致无关意图的引入,从而引发槽位预测错误。为此,本文提出一种名为DGIF的框架,该框架首先利用标签的语义信息为模型提供额外的信号与更丰富的先验知识;随后构建一个多层次交互图,以建模意图与槽位之间的关联关系。具体而言,我们提出一种基于标签语义注入的新型交互图构建方法,能够自动更新图结构,从而更有效地缓解误差传播问题。实验结果表明,所提框架显著优于现有方法,在MixATIS数据集上的整体准确率相对此前最优模型提升了13.7%。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| intent-detection-on-mixatis | DGIF | Accuracy: 83.3 |
| intent-detection-on-mixsnips | DGIF | Accuracy: 97.8 |
| slot-filling-on-mixatis | DGIF | Micro F1: 88.5 |
| slot-filling-on-mixsnips | DGIF | Micro F1: 95.9 |