
摘要
我们介绍了ReFinED,这是一种高效的端到端实体链接模型,该模型利用细粒度实体类型和实体描述来进行链接。ReFinED能够在一次前向传递中完成文档内所有提及的识别、细粒度实体分类和实体消歧,其速度比现有的竞争方法快60倍以上。此外,ReFinED在标准实体链接数据集上的表现也超过了现有最先进方法,平均F1值提高了3.7。该模型能够泛化到大规模知识库(如Wikidata,其包含的实体数量是Wikipedia的15倍)并支持零样本实体链接。速度、准确性和规模的结合使得ReFinED成为从网络规模数据集中提取实体的有效且成本效益高的系统,该模型已成功部署应用。我们的代码和预训练模型可在https://github.com/alexa/ReFinED 获取。
代码仓库
amazon-science/ReFinED
pytorch
GitHub 中提及
alexa/refined
官方
pytorch
GitHub 中提及
amazon-research/ReFinED
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-disambiguation-on-ace2004 | ReFinED | Micro-F1: 91.6 |
| entity-disambiguation-on-aida-conll | ReFinED | In-KB Accuracy: 93.9 |
| entity-disambiguation-on-aquaint | ReFinED | Micro-F1: 91.8 |
| entity-disambiguation-on-msnbc | ReFinED | Micro-F1: 94.4 |
| entity-disambiguation-on-wned-cweb | ReFinED | Micro-F1: 79.4 |
| entity-disambiguation-on-wned-wiki | ReFinED | Micro-F1: 88.7 |
| entity-linking-on-aida-conll | ReFinED | Micro-F1 strong: 84.0 |
| entity-linking-on-derczynski-1 | ReFinED | Micro-F1: 50.7 Micro-F1 strong: 50.7 |
| entity-linking-on-kore50 | ReFinED | Micro-F1: 65.9 Micro-F1 strong: 64.7 |
| entity-linking-on-msnbc-1 | ReFinED | Micro-F1: 71.8 Micro-F1 strong: 71.8 |
| entity-linking-on-n3-reuters-128-1 | ReFinED | Micro-F1: 58.1 Micro-F1 strong: 58.1 |
| entity-linking-on-oke-2015-1 | ReFinED | Micro-F1: 65.0 Micro-F1 strong: 64.4 |
| entity-linking-on-oke-2016-1 | ReFinED | Micro-F1: 59.5 Micro-F1 strong: 59.1 |
| entity-linking-on-webqsp-wd | ReFinED | F1: 89.1 |
| entity-typing-on-aida-conll | ReFinED | Micro-F1: 84.0 |