3 个月前

UniK-QA:面向开放域问答的结构化与非结构化知识统一表示

UniK-QA:面向开放域问答的结构化与非结构化知识统一表示

摘要

我们研究在结构化、非结构化及半结构化知识源(包括文本、表格、列表和知识库)支持下的开放域问答任务。与以往工作不同,我们提出了一种统一的方法,通过将所有知识源统一转化为文本形式,从而实现对异构数据的同质化处理,并应用此前仅限于文本源的检索-阅读(retriever-reader)模型。相比最新的基于图的方法,该方法在知识库问答任务上的性能显著提升11个百分点。更重要的是,我们证明了所提出的统一知识模型(UniK-QA)是一种简单而高效融合异构知识源的途径,在两个主流问答基准测试——NaturalQuestions和WebQuestions上,分别将当前最先进水平分别提升了3.5和2.6个百分点。UniK-QA的代码已开源,地址为:https://github.com/facebookresearch/UniK-QA。

代码仓库

facebookresearch/UniK-QA
官方
GitHub 中提及

基准测试

基准方法指标
knowledge-base-question-answering-on-1UniK-QA (T5-base)
Hits@1: 76.7
knowledge-base-question-answering-on-1UniK-QA (T5-large)
Hits@1: 79.1
open-domain-question-answering-onUniK-QA
Exact Match: 57.7
open-domain-question-answering-on-naturalUniK-QA
Exact Match: 54.9
open-domain-question-answering-on-tqaUniK-QA
Exact Match: 65.5
question-answering-on-natural-questions-longUniK-QA
EM: 54.9
question-answering-on-tiqUnik-Qa
P@1: 42.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
UniK-QA:面向开放域问答的结构化与非结构化知识统一表示 | 论文 | HyperAI超神经