4 个月前

代码同义词确实重要:用于自动ICD编码的多同义词匹配网络

代码同义词确实重要:用于自动ICD编码的多同义词匹配网络

摘要

自动ICD编码定义为将疾病代码分配给电子病历(EMRs)。现有的方法通常应用标签注意力机制结合代码表示来匹配相关的文本片段。与这些基于代码层次结构或描述建模标签的工作不同,我们认为代码同义词可以提供更为全面的知识,这是基于观察到电子病历中的代码表达与其在ICD中的描述存在差异。通过将代码与UMLS中的概念对齐,我们收集了每个代码的同义词。随后,我们提出了一种多同义词匹配网络,利用同义词进行更有效的代码表示学习,最终帮助代码分类。在MIMIC-III数据集上的实验表明,我们提出的方法优于之前的最先进方法。

代码仓库

ganjinzero/icd-msmn
官方
pytorch

基准测试

基准方法指标
medical-code-prediction-on-mimic-iiiMSMN
Macro-AUC: 95.0
Macro-F1: 10.3
Micro-AUC: 99.2
Micro-F1: 58.4
Precision@15: 59.9
Precision@8: 75.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
代码同义词确实重要:用于自动ICD编码的多同义词匹配网络 | 论文 | HyperAI超神经