4 个月前

DR-BiLSTM:依赖阅读双向长短期记忆网络用于自然语言推理

DR-BiLSTM:依赖阅读双向长短期记忆网络用于自然语言推理

摘要

我们提出了一种新颖的深度学习架构,以解决自然语言推理(NLI)任务。现有的方法大多依赖于简单的读取机制,分别对前提和假设进行独立编码。相比之下,我们提出了一种新颖的依赖读取双向长短期记忆网络(DR-BiLSTM),在编码和推理过程中高效地建模前提与假设之间的关系。此外,我们还引入了一种复杂的集成策略来结合所提出的模型,显著提高了最终预测的准确性。最后,我们展示了通过增加一个预处理步骤可以进一步提升结果。我们的评估表明,DR-BiLSTM不仅在单个模型上取得了最佳成绩,在集成模型上也达到了新的最先进水平,在斯坦福自然语言推理数据集上获得了最高的分数。

基准测试

基准方法指标
natural-language-inference-on-snli450D DR-BiLSTM
% Test Accuracy: 88.5
% Train Accuracy: 94.1
Parameters: 7.5m
natural-language-inference-on-snli450D DR-BiLSTM Ensemble
% Test Accuracy: 89.3
% Train Accuracy: 94.8
Parameters: 45m

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DR-BiLSTM:依赖阅读双向长短期记忆网络用于自然语言推理 | 论文 | HyperAI超神经