3 个月前

去噪远距离监督的开放域问答

去噪远距离监督的开放域问答

摘要

远程监督开放域问答(DS-QA)旨在从无标注文本集合中寻找答案。现有的DS-QA模型通常从大规模语料库中检索相关段落,并采用阅读理解技术从最相关的段落中提取答案,却忽略了其他段落中蕴含的丰富信息。此外,远程监督数据不可避免地存在标注错误问题,这些噪声数据会显著降低DS-QA模型的性能。为解决上述问题,我们提出一种新型DS-QA模型,该模型包含一个段落选择器,用于过滤掉噪声段落,以及一个段落阅读器,用于从去噪后的段落中提取正确答案。在真实数据集上的实验结果表明,所提模型能够有效利用噪声数据中的有用信息,在DS-QA任务上显著优于所有基线方法。

基准测试

基准方法指标
open-domain-question-answering-on-quasarDenoising QA
EM (Quasar-T): 42.2
F1 (Quasar-T): 49.3
open-domain-question-answering-on-searchqaDenoising QA
EM: 58.8
F1: 64.5
N-gram F1: -
Unigram Acc: -
question-answering-on-quasart-tDenoising QA
EM: 42.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
去噪远距离监督的开放域问答 | 论文 | HyperAI超神经