
摘要
在关系抽取任务中,实体作为基本构成要素,具有特定的结构特征。本文将这种结构形式化为实体提及对之间的独特依赖关系。为此,我们提出SSAN模型,该模型将此类结构化依赖关系融入标准自注意力机制,并贯穿整个编码过程。具体而言,我们在每个自注意力模块内部设计了两种可选的变换模块,用于生成注意力偏置,从而自适应地调控注意力传播过程。实验结果表明,所提出的实体结构具有显著有效性,SSAN模型在多个主流文档级关系抽取数据集上均显著优于现有竞争性基线方法,取得了新的最先进性能。此外,我们通过消融实验与可视化分析,进一步展示了实体结构如何引导模型实现更优的关系抽取效果。相关代码已公开发布。
代码仓库
fduyjx/rsman
pytorch
GitHub 中提及
BenfengXu/SSAN
官方
pytorch
GitHub 中提及
PaddlePaddle/Research
官方
paddle
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| relation-extraction-on-cdr | SSANBiaffine | F1: 68.7 |
| relation-extraction-on-docred | SSAN-RoBERTa-large+Adaptation | F1: 65.92 Ign F1: 63.78 |
| relation-extraction-on-docred | SSAN-RoBERTa-base | F1: 59.94 Ign F1: 57.71 |
| relation-extraction-on-docred | SSAN-BERT-base | F1: 58.16 Ign F1: 55.84 |
| relation-extraction-on-docred | SSAN-RoBERTa-large | F1: 61.42 Ign F1: 59.47 |
| relation-extraction-on-gda | SSANBiaffine | F1: 83.9 |