3 个月前

FGN:用于中文命名实体识别的融合字形网络

FGN:用于中文命名实体识别的融合字形网络

摘要

中文命名实体识别(Chinese NER)是一项具有挑战性的任务。由于汉字作为表意文字,其内部蕴含着丰富的字形(glyph)信息,而这些信息在以往的研究中往往被忽视。本文提出了一种名为Fusion Glyph Network(FGN)的新型神经网络架构,用于提升中文命名实体识别性能。该方法不仅引入了字形信息,还通过融合机制引入了字符间的交互信息。FGN的主要创新点包括:(1)提出一种新颖的CNN结构——CGS-CNN(Character Glyph Structure CNN),用于同时捕捉相邻字符之间的字形特征及其相互作用信息;(2)设计了一种结合滑动窗口与Slice-Attention机制的方法,实现对单个字符的BERT表示与字形表示的有效融合,从而挖掘上下文与字形之间的潜在交互知识。在四个公开的中文NER数据集上的实验结果表明,采用LSTM-CRF作为标注器的FGN模型达到了当前最先进的性能。此外,本文还进行了多组消融实验,系统分析了FGN中各组件及不同设置对最终效果的影响。

代码仓库

AidenHuen/FGN-NER
官方
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FGN:用于中文命名实体识别的融合字形网络 | 论文 | HyperAI超神经