3 个月前

科学文献中的联合实体与关系抽取:语言信息与实体类型的作用

科学文献中的联合实体与关系抽取:语言信息与实体类型的作用

摘要

科学文献包含多种领域特定的实体及其相互关系。这些实体及其关系能够简洁地捕捉文档主题的重要信息,因此在理解与自动分析文献方面具有关键作用。本文旨在利用深度神经网络模型,自动从科学摘要中提取实体与关系。给定一个输入句子,我们首先使用预训练的Transformer模型生成词元(token)的上下文嵌入表示,并进一步融合其词性(POS)标签的嵌入信息,以丰富词元表征。一系列经过增强的词元表示构成一个跨度(span),实体与关系在跨度上联合学习。实体分类器预测的实体得分(logits)被用作关系分类器的特征输入。实验结果表明,所提出的模型在SciERC和ADE数据集上的实体与关系抽取任务中,均优于现有文献中的竞争性基线方法。

基准测试

基准方法指标
joint-entity-and-relation-extraction-onSpERT.PL (SciBERT)
Cross Sentence: No
Entity F1: 70.53
Relation F1: 51.25
relation-extraction-on-ade-corpusSpERT.PL (with overlap and BioBERT)
NER Macro F1: 91.17
RE+ Macro F1: 82.03
relation-extraction-on-ade-corpusSpERT.PL (without overlap and BioBERT)
NER Macro F1: 91.14
RE+ Macro F1: 82.39

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
科学文献中的联合实体与关系抽取:语言信息与实体类型的作用 | 论文 | HyperAI超神经