
摘要
我们提出了一种新颖的端到端神经模型,用于提取实体及其之间的关系。该模型基于递归神经网络(RNN),通过在双向序列LSTM-RNN上堆叠双向树结构LSTM-RNN,捕捉了词序和依赖树子结构的信息。这使得我们的模型能够在单个模型中使用共享参数联合表示实体和关系。此外,我们在训练过程中通过实体预训练和计划采样方法促进实体检测,并在关系抽取中利用实体信息。我们的模型在端到端关系抽取任务上超越了现有的基于特征的最先进模型,在ACE2005和ACE2004数据集上的F1分数分别实现了12.1%和5.7%的相对错误率降低。我们还展示了基于LSTM-RNN的模型在名义关系分类任务(SemEval-2010 Task 8)上的F1分数优于现有的基于卷积神经网络(CNN)的最先进模型。最后,我们对模型的多个组件进行了详尽的消融分析。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| relation-extraction-on-ace-2004 | SPTree | Cross Sentence: No NER Micro F1: 81.8 RE+ Micro F1: 48.4 |
| relation-extraction-on-ace-2005 | SPTree | Cross Sentence: No NER Micro F1: 83.4 RE+ Micro F1: 55.6 Sentence Encoder: biLSTM |
| relation-extraction-on-nyt11-hrl | SPTree | F1: 53.1 |