
摘要
实体链接是现代检索系统中的标准组件,通常由第三方工具包实现。尽管开源方案众多,但要找到一个具备模块化架构、可灵活替换部分组件,不依赖外部资源,能够轻松升级至新版维基百科数据,且最重要的是具备当前最先进性能的单一系统,仍然十分困难。本文提出的REL系统旨在填补这一空白。该系统基于自然语言处理研究中的前沿神经网络组件构建,以Python包和Web API两种形式提供。此外,我们还在标准实体链接基准测试上,对REL系统与多个成熟系统及当前最先进方法进行了实验性对比评估。
代码仓库
informagi/REL
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-linking-on-aida-conll | van Hulst et al. (2020) | Micro-F1 strong: 80.5 |
| entity-linking-on-derczynski-1 | van Hulst et al. (2020) | Micro-F1: 41.1 |
| entity-linking-on-msnbc-1 | van Hulst et al. (2020) | Micro-F1: 72.4 |