
摘要
在本文中,我们提出了一种名为DiffusionNER的方法,该方法将命名实体识别任务建模为边界去噪扩散过程,从而从噪声跨度生成命名实体。在训练过程中,DiffusionNER通过一个固定的前向扩散过程逐渐向黄金实体边界添加噪声,并学习一个逆向扩散过程以恢复实体边界。在推理阶段,DiffusionNER首先从标准高斯分布中随机采样一些噪声跨度,然后利用所学的逆向扩散过程对其进行去噪,生成命名实体。所提出的边界去噪扩散过程允许逐步细化和动态采样实体,赋予DiffusionNER高效且灵活的实体生成能力。在多个平面和嵌套命名实体识别数据集上的实验表明,DiffusionNER的性能与先前的最先进模型相当或甚至更优。
代码仓库
microsoft/CyBERTron-LM
pytorch
GitHub 中提及
tricktreat/diffusionner
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| chinese-named-entity-recognition-on-msra | DiffusionNER | F1: 94.91 |
| named-entity-recognition-ner-on-conll-2003 | DiffusionNER | F1: 92.78 |
| named-entity-recognition-ner-on-ontonotes-v5 | DiffusionNER | F1: 90.66 |
| named-entity-recognition-on-ace-2005 | DiffusionNER | F1: 86.93 |
| nested-named-entity-recognition-on-ace-2004 | DiffusionNER | F1: 88.39 |
| nested-named-entity-recognition-on-genia | DiffusionNER | F1: 81.53 |