
摘要
文档级关系抽取旨在从文档中提取多个实体对之间的关系。以往提出的基于图或基于Transformer的模型通常独立处理各个实体,而忽略了关系三元组之间的全局信息。本文提出一种新方法,通过预测一个实体级关系矩阵,以同时捕捉局部与全局信息,其思路与计算机视觉中的语义分割任务类似。为此,我们提出了一个面向文档级关系抽取的文档U型网络(Document U-shaped Network)。具体而言,该模型采用编码器模块来捕获实体的上下文信息,并引入一种类似图像风格特征图的U型分割模块,以捕捉三元组之间的全局依赖关系。实验结果表明,该方法在三个基准数据集DocRED、CDR和GDA上均取得了当前最优的性能表现。
代码仓库
zjunlp/DocuNet
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| relation-extraction-on-cdr | DocuNet-SciBERTbase | F1: 76.3 |
| relation-extraction-on-docred | DocuNet-RoBERTa-large | F1: 64.55 Ign F1: 62.4 |
| relation-extraction-on-gda | DocuNet-SciBERTbase | F1: 85.3 |
| relation-extraction-on-redocred | DocuNET | F1: 77.87 Ign F1: 77.26 |