
摘要
命名实体识别(Named Entity Recognition, NER)是自然语言处理中的基础任务,旨在识别文本中表示实体引用的词元片段。以往的NER研究多集中于扁平实体(flat NER),忽略了实体引用可能具有嵌套结构的事实,例如 [Bank of [China]](Finkel 和 Manning,2009)。本文借鉴基于图的依存句法分析思想,采用双仿射模型(biaffine model,Dozat 和 Manning,2017)为模型提供对输入文本的全局视角。该模型对句子中所有起始与结束词元的组合进行打分,从而全面探索所有可能的文本片段,使模型能够更准确地预测命名实体。通过在8个语料库上的实验评估,我们验证了该模型在嵌套与扁平NER任务中均表现优异,并在所有语料上均达到当前最优(SoTA)性能,最高准确率提升达2.2个百分点。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| named-entity-recognition-ner-on-conll-2003 | Biaffine-NER | F1: 93.5 |
| named-entity-recognition-ner-on-ontonotes-v5 | Biaffine-NER | F1: 91.3 |
| named-entity-recognition-on-ace-2004 | Biaffine-NER | F1: 86.7 Multi-Task Supervision: n |
| named-entity-recognition-on-ace-2005 | Biaffine-NER | F1: 85.4 |
| named-entity-recognition-on-conll-2002 | Biaffine-NER | F1: 90.3 |
| named-entity-recognition-on-conll-2002-dutch | Biaffine-NER | F1: 93.7 |
| named-entity-recognition-on-conll-2003-german | Biaffine-NER | F1: 86.4 |
| named-entity-recognition-on-conll-2003-german-1 | Biaffine-NER | F1: 90.3 |
| named-entity-recognition-on-genia | Biaffine-NER | F1: 80.5 |