4 个月前

基于临床文本的可解释医学代码预测

基于临床文本的可解释医学代码预测

摘要

临床笔记是由医生在每次患者就诊时创建的文本文件。这些笔记通常附有医学代码,用于描述诊断和治疗情况。然而,标注这些代码既费时又容易出错;此外,代码与文本之间的关联未被标注,导致特定诊断和治疗背后的原因和细节变得模糊不清。本文介绍了一种基于注意力机制的卷积神经网络模型,该模型可以从临床文本中预测医学代码。我们的方法利用卷积神经网络在文档中聚合信息,并通过注意力机制选择数千个可能代码中最相关的段落。该方法具有较高的准确性,达到了 Precision@8 为 0.71 和 Micro-F1 为 0.54 的性能指标,均优于此前的最先进水平。此外,通过一位医生对模型可解释性的评估,我们证明了注意力机制能够为每个代码分配提供有意义的解释。

代码仓库

基准测试

基准方法指标
medical-code-prediction-on-mimic-iiiDR-CAML
Macro-AUC: 89.7
Macro-F1: 8.6
Micro-AUC: 98.5
Micro-F1: 52.9
Precision@15: 54.8
Precision@8: 69.0
medical-code-prediction-on-mimic-iiiBi-GRU
Macro-AUC: 82.2
Macro-F1: 3.8
Micro-AUC: 97.1
Micro-F1: 41.7
Precision@15: 44.5
Precision@8: 58.5
medical-code-prediction-on-mimic-iiiLogistic Regression
Macro-AUC: 56.1
Macro-F1: 1.1
Micro-AUC: 93.7
Micro-F1: 27.2
Precision@15: 41.1
Precision@8: 54.2
medical-code-prediction-on-mimic-iiiSVM
Micro-F1: 44.1
medical-code-prediction-on-mimic-iiiCNN
Macro-AUC: 80.6
Macro-F1: 4.2
Micro-AUC: 96.9
Micro-F1: 41.9
Precision@15: 44.3
Precision@8: 58.1
medical-code-prediction-on-mimic-iiiCAML
Macro-AUC: 89.5
Macro-F1: 8.8
Micro-AUC: 98.6
Micro-F1: 53.9
Precision@15: 56.1
Precision@8: 70.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于临床文本的可解释医学代码预测 | 论文 | HyperAI超神经