4 个月前

用于同义句识别、语义文本相似性、自然语言推理和问答的神经网络模型

用于同义句识别、语义文本相似性、自然语言推理和问答的神经网络模型

摘要

在本文中,我们分析了多种神经网络设计(及其变体)用于句子对建模,并广泛地在八个数据集上比较了它们的性能,这些数据集涵盖了同义句识别、语义文本相似度、自然语言推理和问答任务。尽管大多数模型声称达到了最先进的性能,但原始论文通常仅报告了一两个选定的数据集上的结果。我们提供了系统性的研究,表明:(i) 通过LSTM编码上下文信息以及句子间的交互作用是至关重要的;(ii) Tree-LSTM的效果并不如先前所宣称的那样显著,但在Twitter数据集上意外地提高了性能;(iii) 对于较大的数据集,增强顺序推理模型(Enhanced Sequential Inference Model)目前表现最佳,而在数据较少的情况下,成对词交互模型(Pairwise Word Interaction Model)则取得了最好的性能。我们发布了我们的实现代码作为开源工具包。

代码仓库

lanwuwei/SPM_toolkit
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
paraphrase-identification-on-2017-test-setCNN
10 fold Cross validation: 50

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于同义句识别、语义文本相似性、自然语言推理和问答的神经网络模型 | 论文 | HyperAI超神经