4 个月前

语义句子匹配与密集连接的循环及共注意信息

语义句子匹配与密集连接的循环及共注意信息

摘要

句子匹配在自然语言推理、同义句识别和问答等众多自然语言任务中得到广泛应用。对于这些任务,理解两个句子之间的逻辑和语义关系是必要的,但仍然具有挑战性。尽管注意力机制有助于捕捉语义关系并适当地对齐两个句子的元素,但以往的注意力机制方法仅使用简单的求和操作,这不足以保留原始特征。受密集连接卷积网络(DenseNet)的启发,我们提出了一种密集连接的协同注意循环神经网络,该网络每一层都使用了注意力特征以及所有先前循环层的隐藏特征的拼接信息。这使得从最底层的词嵌入层到最顶层的循环层都能保留原始特征和协同注意特征的信息。为了缓解由于密集拼接操作导致特征向量尺寸不断增加的问题,我们还提出在密集拼接之后使用自编码器。我们在与句子匹配相关的高度竞争基准数据集上评估了所提出的架构。实验结果表明,我们的架构通过保留循环和注意力特征,在大多数任务上达到了最先进的性能。

基准测试

基准方法指标
natural-language-inference-on-snliDensely-Connected Recurrent and Co-Attentive Network Ensemble
% Test Accuracy: 90.1
% Train Accuracy: 95.0
Parameters: 53.3m
natural-language-inference-on-snliDensely-Connected Recurrent and Co-Attentive Network
% Test Accuracy: 88.9
% Train Accuracy: 93.1
Parameters: 6.7m
natural-language-inference-on-snliDensely-Connected Recurrent and Co-Attentive Network (encoder)
% Test Accuracy: 86.5
% Train Accuracy: 91.4
Parameters: 5.6m

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
语义句子匹配与密集连接的循环及共注意信息 | 论文 | HyperAI超神经