
摘要
最近,利用有限标注数据构建可靠的命名实体识别(NER)系统引起了广泛关注。几乎所有现有的研究都严重依赖特定领域的资源,如外部词典和知识库。然而,这些特定领域的资源往往不可获得,同时构建这些资源既困难又昂贵,这已成为更广泛采用该技术的关键障碍。为了解决这一问题,本文提出了一种新颖的鲁棒性和领域适应性方法——RDANER,用于低资源环境下的命名实体识别,该方法仅使用廉价且易于获取的资源。在三个基准数据集上的大量实验表明,我们的方法在仅使用廉价且易于获取的资源时取得了最佳性能,并且与使用难以获取的领域特定资源的最先进方法相比具有竞争力。所有代码和语料库均可在 https://github.com/houking-can/RDANER 获取。
代码仓库
houking-can/RDANER
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| named-entity-recognition-ner-on-bc5cdr | RDANER | F1: 87.38 |
| named-entity-recognition-ner-on-ncbi-disease | RDANER | F1: 87.89 |
| named-entity-recognition-ner-on-scierc | RDANER | F1: 68.96 |