4 个月前

统一命名实体识别作为词-词关系分类

统一命名实体识别作为词-词关系分类

摘要

迄今为止,命名实体识别(NER)主要涉及三种类型,包括平面NER、重叠NER(又称嵌套NER)和不连续NER,这些类型大多被单独研究。最近,对于统一NER的兴趣日益增加,旨在通过单一模型同时解决上述三种任务。目前表现最佳的方法主要包括基于片段的模型和序列到序列模型,但不幸的是,前者仅关注边界识别,而后者可能受到暴露偏差的影响。在本工作中,我们提出了一种新颖的替代方法,即将统一NER建模为词-词关系分类,即W^2NER。该架构通过有效建模实体词之间的邻接关系来解决统一NER的核心瓶颈问题,具体使用了Next-Neighboring-Word (NNW) 和 Tail-Head-Word- (THW-) 关系。基于W^2NER方案,我们开发了一个神经框架,在该框架中,统一NER被建模为一个二维词对网格。随后,我们提出了多粒度二维卷积以更好地优化网格表示。最后,使用了一个共预测器来充分推理词-词关系。我们在14个广泛使用的基准数据集上进行了大量实验(其中8个为英文数据集,6个为中文数据集),结果表明我们的模型超越了所有当前表现最佳的基线模型,推动了统一NER的最先进性能。

代码仓库

ljynlp/w2ner
官方
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
统一命名实体识别作为词-词关系分类 | 论文 | HyperAI超神经