4 个月前

R$^3$: 强化阅读者-排序器用于开放领域问答

R$^3$: 强化阅读者-排序器用于开放领域问答

摘要

近年来,研究人员在将神经网络方法应用于问答(QA)系统方面取得了显著成功。这些方法在简化封闭域设置中(如SQuAD数据集[Rajpurkar等人,2016]),该数据集提供了一段预选的文本,从中可以提取出给定问题的答案,已经达到了最先进的水平。最近,研究人员开始着手解决开放域问答问题,其中模型不仅接收一个问题,还能够访问大型语料库(例如维基百科)而不是一段预选的文本(Chen等人,2017a)。这种设置更为复杂,因为它需要信息检索组件进行大规模的相关段落搜索,并结合一个阅读理解模型来“阅读”这些段落以生成答案。在这种设置下的性能明显落后于封闭域问答的性能。本文介绍了一种新颖的开放域问答系统——强化排序-阅读器(Reinforced Ranker-Reader, $R^3$),该系统基于两项算法创新。首先,我们提出了一种新的开放域问答流水线,其中包括一个排序组件(Ranker),该组件学习根据生成给定问题真实答案的可能性对检索到的段落进行排序。其次,我们提出了一种基于强化学习的新方法,该方法联合训练排序器和答案生成阅读器模型(Reader)。我们报告了广泛的实验结果,表明我们的方法在多个开放域问答数据集上显著优于现有技术水平。

代码仓库

shuohangwang/mprc
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
open-domain-question-answering-on-quasarR^3
EM (Quasar-T): 35.3
F1 (Quasar-T): 41.7
open-domain-question-answering-on-searchqaR^3
EM: 49.0
F1: 55.3
N-gram F1: -
Unigram Acc: -

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
R$^3$: 强化阅读者-排序器用于开放领域问答 | 论文 | HyperAI超神经