4 个月前

比较、压缩与传播:利用对齐因子分解增强神经架构以进行自然语言推理

比较、压缩与传播:利用对齐因子分解增强神经架构以进行自然语言推理

摘要

本文提出了一种新的深度学习架构,用于自然语言推理(Natural Language Inference, NLI)。首先,我们介绍了一种新架构,该架构通过比较、压缩对齐对并将它们传递到上层来增强表示学习。其次,我们采用了因子分解层,以高效且富有表现力的方式将对齐向量压缩为标量特征,这些特征随后被用来增强基础词表示。我们的方法设计旨在概念上简单、紧凑且功能强大。我们在三个流行的基准数据集——SNLI、MultiNLI 和 SciTail 上进行了实验,所有实验均取得了具有竞争力的性能。此外,我们模型的轻量化参数化版本在保持竞争力的同时,相比现有的最先进模型(如 ESIM 和 DIIN)参数量减少了约3倍。另外,可视化分析表明我们的传播特征具有很高的可解释性。

基准测试

基准方法指标
natural-language-inference-on-scitailCAFE
Accuracy: 83.3
natural-language-inference-on-snli300D CAFE (no cross-sentence attention)
% Test Accuracy: 85.9
% Train Accuracy: 87.3
Parameters: 3.7m
natural-language-inference-on-snli300D CAFE
% Test Accuracy: 88.5
% Train Accuracy: 89.8
Parameters: 4.7m
natural-language-inference-on-snli300D CAFE Ensemble
% Test Accuracy: 89.3
% Train Accuracy: 92.5
Parameters: 17.5m

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
比较、压缩与传播:利用对齐因子分解增强神经架构以进行自然语言推理 | 论文 | HyperAI超神经