4 个月前

零资源跨语言命名实体识别

零资源跨语言命名实体识别

摘要

近日,神经网络方法在多种语言的命名实体识别(NER)任务中取得了最先进的(SOTA)结果,而无需手动设计特征。然而,这些模型仍然需要手动标注的训练数据,而许多语言缺乏此类数据。本文提出了一种无监督的跨语言NER模型,该模型能够在完全无监督的情况下将一种语言中的NER知识迁移到另一种语言中,且不依赖任何双语词典或平行数据。我们的模型通过词级别的对抗学习以及参数共享和特征增强的增广微调来实现这一目标。在五种不同语言上的实验表明了我们方法的有效性,其性能显著优于现有模型,并为每一对语言设定了新的SOTA。

代码仓库

基准测试

基准方法指标
low-resource-named-entity-recognition-on-4Zero-Resource Transfer From CoNLL-2003 English dataset.
F1 score: 65.24
low-resource-named-entity-recognition-on-5Zero-Resource Cross-lingual Transfer From CoNLL-2003 English dataset.
F1 score: 75.93
low-resource-named-entity-recognition-on-6Zero-Resource Transfer From CoNLL-2003 English dataset.
F1 score: 74.61

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
零资源跨语言命名实体识别 | 论文 | HyperAI超神经