8 个月前

自然语言处理

卷积神经网络

自然语言处理

Jingye Li Hao Fei Jiang Liu Shengqiong Wu Meishan Zhang Chong Teng Donghong Ji Fei Li

摘要

迄今为止，命名实体识别（NER）主要涉及三种类型，包括平面NER、重叠NER（又称嵌套NER）和不连续NER，这些类型大多被单独研究。最近，对于统一NER的兴趣日益增加，旨在通过单一模型同时解决上述三种任务。目前表现最佳的方法主要包括基于片段的模型和序列到序列模型，但不幸的是，前者仅关注边界识别，而后者可能受到暴露偏差的影响。在本工作中，我们提出了一种新颖的替代方法，即将统一NER建模为词-词关系分类，即W^2NER。该架构通过有效建模实体词之间的邻接关系来解决统一NER的核心瓶颈问题，具体使用了Next-Neighboring-Word (NNW) 和 Tail-Head-Word- (THW-) 关系。基于W^2NER方案，我们开发了一个神经框架，在该框架中，统一NER被建模为一个二维词对网格。随后，我们提出了多粒度二维卷积以更好地优化网格表示。最后，使用了一个共预测器来充分推理词-词关系。我们在14个广泛使用的基准数据集上进行了大量实验（其中8个为英文数据集，6个为中文数据集），结果表明我们的模型超越了所有当前表现最佳的基线模型，推动了统一NER的最先进性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

自然语言处理

卷积神经网络

自然语言处理

Jingye Li Hao Fei Jiang Liu Shengqiong Wu Meishan Zhang Chong Teng Donghong Ji Fei Li

摘要

迄今为止，命名实体识别（NER）主要涉及三种类型，包括平面NER、重叠NER（又称嵌套NER）和不连续NER，这些类型大多被单独研究。最近，对于统一NER的兴趣日益增加，旨在通过单一模型同时解决上述三种任务。目前表现最佳的方法主要包括基于片段的模型和序列到序列模型，但不幸的是，前者仅关注边界识别，而后者可能受到暴露偏差的影响。在本工作中，我们提出了一种新颖的替代方法，即将统一NER建模为词-词关系分类，即W^2NER。该架构通过有效建模实体词之间的邻接关系来解决统一NER的核心瓶颈问题，具体使用了Next-Neighboring-Word (NNW) 和 Tail-Head-Word- (THW-) 关系。基于W^2NER方案，我们开发了一个神经框架，在该框架中，统一NER被建模为一个二维词对网格。随后，我们提出了多粒度二维卷积以更好地优化网格表示。最后，使用了一个共预测器来充分推理词-词关系。我们在14个广泛使用的基准数据集上进行了大量实验（其中8个为英文数据集，6个为中文数据集），结果表明我们的模型超越了所有当前表现最佳的基线模型，推动了统一NER的最先进性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供