3 个月前

多领域研究论文中的指代消解

多领域研究论文中的指代消解

摘要

共指消解对于自动文本理解至关重要,是实现文本摘要、问答系统等高级信息检索任务的基础。以往研究表明,当前最先进的方法(如基于BERT的模型)在应用于科研论文时,性能显著下降。本文针对科研论文中的共指消解任务及其后续知识图谱构建展开研究,并提出以下贡献:(1)我们构建了一个共指消解语料库,涵盖来自科学(Science)、技术(Technology)与医学(Medicine)(STM)领域的10个不同学科;(2)我们提出了一种面向科研论文的迁移学习方法,用于实现自动共指消解;(3)我们系统分析了共指消解对知识图谱(Knowledge Graph, KG)构建质量的影响;(4)我们发布了由55,485篇来自10个STM领域科研论文自动生成的知识图谱。全面的实验结果表明,所提出方法具有显著实用性。我们的迁移学习方法在自建语料库上的F1得分达到61.4,较现有最先进基线模型提升11.0个百分点;在与人工标注的黄金标准知识图谱对比评估中,共指消解使生成知识图谱的质量显著提升,F1得分达到63.5,相较基线提升21.8个百分点。

代码仓库

arthurbra/stm-coref
官方
tf
GitHub 中提及

基准测试

基准方法指标
coreference-resolution-on-stm-corefBFCR + SpanBERT + Transfer Learning
CoNLL F1: 61.4
coreference-resolution-on-stm-corefBFCR + SpanBERT
CoNLL F1: 50.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多领域研究论文中的指代消解 | 论文 | HyperAI超神经