4 个月前

一种需要离散推理的多类型多跨度阅读理解网络

一种需要离散推理的多类型多跨度阅读理解网络

摘要

在阅读理解和问答领域已经取得了快速进展,其中一些系统在某些简化的设置中达到了人类水平。然而,当这些模型应用于更现实的情境时,其性能显著下降,例如答案涉及多种类型、多个文本片段为正确答案或需要离散推理能力的情况。本文介绍了一种多类型多跨度网络(Multi-Type Multi-Span Network, MTMSN),这是一种神经阅读理解模型,结合了支持多种答案类型(如片段、计数、否定和算术表达式)的多类型答案预测器以及用于动态生成一个或多个文本片段的多跨度提取方法。此外,还提出了一种算术表达式重排序机制,用于对表达式候选进行排名以进一步确认预测结果。实验表明,我们的模型在DROP隐藏测试集上达到了79.9的F1分数,创造了新的最先进结果。源代码已发布(\url{https://github.com/huminghao16/MTMSN}),以促进未来的研究工作。

代码仓库

huminghao16/MTMSN
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
question-answering-on-drop-testMTMSN Large
F1: 79.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种需要离散推理的多类型多跨度阅读理解网络 | 论文 | HyperAI超神经