4 个月前

CollaboNet:深度神经网络在生物医学命名实体识别中的协作

CollaboNet:深度神经网络在生物医学命名实体识别中的协作

摘要

背景:在生物医学文本挖掘中,识别生物医学命名实体是最基本的任务之一。近年来,基于深度学习的方法已被应用于生物医学命名实体识别(BioNER),并显示出令人鼓舞的结果。然而,由于深度学习方法需要大量的训练数据,数据不足会阻碍其性能。生物医学命名实体数据集是一种稀缺资源,每个数据集仅涵盖少量的实体类型。此外,许多生物实体具有多义性,这是命名实体识别中的主要障碍之一。结果:为了解决数据不足和实体类型误分类的问题,我们提出了CollaboNet模型,该模型利用了多个命名实体识别(NER)模型的组合。在CollaboNet中,不同数据集上训练的模型相互连接,目标模型可以从其他协作模型获取信息以减少假阳性。每个模型在其目标实体类型上都是专家,并在训练过程中轮流担任目标模型和协作模型的角色。实验结果表明,CollaboNet可以显著减少假阳性和包括多义词在内的误分类实体的数量。CollaboNet在精确度、召回率和F1分数方面均达到了最先进的水平。结论:我们展示了将多个模型结合用于BioNER的优势。通过利用针对不同实体类型注释的多个数据集,我们的模型成功减少了误分类实体的数量,并提高了性能。鉴于我们的模型达到的最先进水平,我们认为CollaboNet可以提高下游生物医学文本挖掘应用(如生物实体关系提取)的准确性。

代码仓库

wonjininfo/CollaboNet
官方
tf
GitHub 中提及
ncbi-nlp/BLUE_Benchmark
GitHub 中提及

基准测试

基准方法指标
named-entity-recognition-ner-on-bc5cdrCollaboNet
F1: 87.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CollaboNet:深度神经网络在生物医学命名实体识别中的协作 | 论文 | HyperAI超神经