7 个月前

卷积神经网络

自然语言处理

自然语言处理

Yuying Zhu; Guoxin Wang; Börje F. Karlsson

摘要

中文命名实体识别（NER）至关重要但难度较大，主要是因为缺乏自然分隔符。因此，中文分词（CWS）通常被视为中文NER的第一步。然而，基于词级嵌入和词典特征的模型往往受到分词错误和未登录词（OOV）的影响。在本文中，我们研究了一种称为CAN的卷积注意力网络用于中文NER，该网络由一个带有局部注意力层的字符级卷积神经网络（CNN）和一个带有全局自注意力层的门控循环单元（GRU）组成，以捕捉相邻字符和句子上下文的信息。此外，与其他模型相比，我们的模型不依赖任何外部资源如词典，并且使用较小尺寸的字符嵌入，这使得我们的模型更加实用。广泛的实验结果表明，在不同领域的数据集上，包括微博、MSRA和中文简历NER数据集，我们的方法在不使用词嵌入和外部词典资源的情况下优于现有最先进方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

自然语言处理

自然语言处理

Yuying Zhu; Guoxin Wang; Börje F. Karlsson

摘要

中文命名实体识别（NER）至关重要但难度较大，主要是因为缺乏自然分隔符。因此，中文分词（CWS）通常被视为中文NER的第一步。然而，基于词级嵌入和词典特征的模型往往受到分词错误和未登录词（OOV）的影响。在本文中，我们研究了一种称为CAN的卷积注意力网络用于中文NER，该网络由一个带有局部注意力层的字符级卷积神经网络（CNN）和一个带有全局自注意力层的门控循环单元（GRU）组成，以捕捉相邻字符和句子上下文的信息。此外，与其他模型相比，我们的模型不依赖任何外部资源如词典，并且使用较小尺寸的字符嵌入，这使得我们的模型更加实用。广泛的实验结果表明，在不同领域的数据集上，包括微博、MSRA和中文简历NER数据集，我们的方法在不使用词嵌入和外部词典资源的情况下优于现有最先进方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供