4 个月前

构建跨文档多跳阅读理解数据集

构建跨文档多跳阅读理解数据集

摘要

大多数阅读理解方法仅限于可以通过单个句子、段落或文档回答的问题。使模型能够结合分散的文本证据将扩展机器理解方法的应用范围,但目前尚缺乏用于训练和测试这一能力的资源。我们提出了一项新任务,旨在促进跨多个文档进行文本理解的模型开发,并探讨现有方法的局限性。在该任务中,模型学习寻找并结合证据——实际上是在执行多跳(或多步)推理。我们设计了一种方法,以给定的一系列问题-答案对和主题相关的文档为基础生成适用于此任务的数据集。从不同领域生成了两个数据集,并识别了潜在的陷阱及制定了规避策略。我们评估了两种先前提出的具有竞争力的模型,发现其中一个可以整合跨文档的信息。然而,这两种模型在选择相关信息方面都存在困难,因为提供保证相关性的文档会显著提高它们的表现。尽管这些模型超越了几种强大的基线模型,但其最佳准确率仅为42.9%,而人类的表现为74.0%——这表明仍有很大的改进空间。

基准测试

基准方法指标
question-answering-on-wikihopBiDAF
Test: 42.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
构建跨文档多跳阅读理解数据集 | 论文 | HyperAI超神经