3 个月前

基于本地知识图谱构建的Seq2Seq模型多文档输入扩展方法

基于本地知识图谱构建的Seq2Seq模型多文档输入扩展方法

摘要

基于查询的开放域自然语言处理任务需要从长且多样化的网络搜索结果中进行信息综合。现有方法通常采用诸如TF-IDF排序等技术,从网络文本中抽取部分片段作为序列到序列(Sequence-to-Sequence)模型的输入。我们提出为每个查询构建一个局部图结构的知识库,以压缩网络搜索信息并减少冗余。我们证明,通过将该图线性化为结构化的输入序列,模型能够在标准的序列到序列框架内有效编码图结构表示。在两项输入文本极长的生成式任务——长文本问答与多文档摘要中,将图结构表示作为输入,其性能优于直接使用检索到的文本片段。

代码仓库

denisewong1/ASX300
tf
GitHub 中提及

基准测试

基准方法指标
open-domain-question-answering-on-eli5E-MCA
Rouge-1: 30.0
Rouge-2: 5.8
Rouge-L: 24.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于本地知识图谱构建的Seq2Seq模型多文档输入扩展方法 | 论文 | HyperAI超神经