HyperAIHyperAI

Command Palette

Search for a command to run...

R2-D2:开放域问答的模块化基线

Martin Fajcik Martin Docekal Karel Ondrej Pavel Smrz

摘要

本文提出了一种新型的四阶段开放域问答流水线R2-D2(两次排序,两次阅读)。该流水线由检索器、段落重排序器、抽取式阅读器、生成式阅读器以及一个整合系统各组件最终预测结果的聚合机制组成。我们在三个开放域问答数据集(NaturalQuestions、TriviaQA 和 EfficientQA)上验证了该方法的有效性,在前两个数据集上均超越了现有最先进水平。我们的分析表明:(i)将抽取式阅读器与生成式阅读器相结合,可带来最高达5个百分点的精确匹配(Exact Match)绝对提升,且其效果至少是采用不同参数配置的相同模型后验平均集成方法的两倍;(ii)参数量更少的抽取式阅读器在抽取式问答数据集上的表现可与生成式阅读器相当。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
R2-D2:开放域问答的模块化基线 | 论文 | HyperAI超神经