
摘要
本文提出了一种新的框架——MGNER(多粒度命名实体识别),用于处理句子中多个实体或实体提及可能非重叠或完全嵌套的多粒度命名实体识别任务。与传统方法将命名实体识别视为序列标注任务并连续标注实体不同,MGNER能够在多个粒度上检测和识别实体,无需显式假设实体是非重叠或完全嵌套的结构。MGNER由一个检测器和一个分类器组成,其中检测器负责检查所有可能的词段,而分类器则对实体进行分类。此外,该框架在整个过程中利用了上下文信息和自注意力机制来提高命名实体识别的性能。实验结果表明,在嵌套/非重叠命名实体识别任务中,MGNER在F1分数方面比当前最先进的基线模型最高提升了4.4%。
代码仓库
congyingxia/Multi-Grained-NER
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| named-entity-recognition-ner-on-conll-2003 | MGNER | F1: 92.28 |
| named-entity-recognition-on-ace-2004 | MGNER | F1: 79.5 Multi-Task Supervision: n |
| named-entity-recognition-on-ace-2005 | MGNER | F1: 78.2 |
| nested-mention-recognition-on-ace-2004 | MGNER | F1: 79.5 |
| nested-mention-recognition-on-ace-2005 | MGNER | F1: 78.2 |
| nested-named-entity-recognition-on-ace-2004 | MGNER | F1: 79.5 |
| nested-named-entity-recognition-on-ace-2005 | MGNER | F1: 78.2 |