
摘要
本文提出了一种新的深度学习架构,用于自然语言推理(Natural Language Inference, NLI)。首先,我们介绍了一种新架构,该架构通过比较、压缩对齐对并将它们传递到上层来增强表示学习。其次,我们采用了因子分解层,以高效且富有表现力的方式将对齐向量压缩为标量特征,这些特征随后被用来增强基础词表示。我们的方法设计旨在概念上简单、紧凑且功能强大。我们在三个流行的基准数据集——SNLI、MultiNLI 和 SciTail 上进行了实验,所有实验均取得了具有竞争力的性能。此外,我们模型的轻量化参数化版本在保持竞争力的同时,相比现有的最先进模型(如 ESIM 和 DIIN)参数量减少了约3倍。另外,可视化分析表明我们的传播特征具有很高的可解释性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| natural-language-inference-on-scitail | CAFE | Accuracy: 83.3 |
| natural-language-inference-on-snli | 300D CAFE (no cross-sentence attention) | % Test Accuracy: 85.9 % Train Accuracy: 87.3 Parameters: 3.7m |
| natural-language-inference-on-snli | 300D CAFE | % Test Accuracy: 88.5 % Train Accuracy: 89.8 Parameters: 4.7m |
| natural-language-inference-on-snli | 300D CAFE Ensemble | % Test Accuracy: 89.3 % Train Accuracy: 92.5 Parameters: 17.5m |