4 个月前

多范围推理在机器理解中的应用

多范围推理在机器理解中的应用

摘要

我们提出了一种新的快速组合编码器——多范围推理单元(Multi-Range Reasoning Units,简称MRU),用于机器理解(Machine Comprehension,简称MC)。所提出的MRU编码器具有多范围门控机制,通过执行一系列参数化的收缩与扩展层来学习门控向量,从而利用长短期依赖关系。我们的方法旨在实现以下目标:(1) 学习同时考虑长短期上下文的表示;(2) 建模文档内块之间的关系;(3) 实现快速高效的序列编码。实验结果表明,所提出的编码器无论是作为独立编码器还是作为辅助构建模块,都表现出令人鼓舞的结果。我们在三个具有挑战性的机器理解数据集上进行了广泛的实验,即RACE、SearchQA和NarrativeQA,在所有数据集上均取得了极具竞争力的性能。在RACE基准测试中,我们的模型在不使用任何递归或卷积层的情况下,比动态融合网络(Dynamic Fusion Networks,简称DFN)提高了1.5%-6%的性能。同样,在SearchQA基准测试中,我们的模型在不使用任何LSTM/GRU层的情况下,相对于AMANDA表现出有竞争力的性能;在NarrativeQA基准测试中,相对于双向注意力流模型(Bidirectional Attention Flow Model,简称BiDAF)也表现出有竞争力的性能。最后,将MRU编码器与标准的双向LSTM架构结合进一步提升了性能,达到了当前最先进的水平。

基准测试

基准方法指标
question-answering-on-raceBiAttention MRU
RACE: 53.3
RACE-h: 50.3
RACE-m: 60.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多范围推理在机器理解中的应用 | 论文 | HyperAI超神经