
摘要
命名实体识别(Named Entity Recognition, NER)是一种信息抽取技术,旨在识别文档中的命名实体(如组织、地点等)并将其分类到预定义的类别中。准确识别这些实体短语在简化信息获取方面具有重要意义。然而,该任务仍具挑战性,因为命名实体具有多种形式且高度依赖上下文。尽管上下文信息可通过上下文特征进行建模,但现有模型往往难以充分捕捉实体之间的全局关系。本文提出将XLNet提供的上下文特征与图卷积网络(Graph Convolution Network, GCN)提取的全局特征相结合,以提升NER性能。在广泛使用的CoNLL 2003数据集上的实验结果表明,该方法显著提升了识别效果,性能达到与当前最先进(State-of-the-Art, SOTA)水平相当的水平。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| named-entity-recognition-ner-on-conll-2003 | XLNet | F1: 93.28 |
| named-entity-recognition-ner-on-conll-2003 | XLNet-GCN | F1: 93.82 |
| named-entity-recognition-ner-on-conll-2003 | GCN | F1: 88.63 |