3 个月前

利用话语结构与一致化编码嵌入的自动ICD编码

利用话语结构与一致化编码嵌入的自动ICD编码

摘要

国际疾病分类(ICD)是全球健康统计与流行病学的基石,其作用是将各类健康状况转化为字母数字编码。由于人工编码工作繁重,且全球范围内医疗人员短缺,已有多种自动ICD编码方法被提出。然而,现有研究未能充分挖掘临床病历文本中的语篇结构信息,而这些信息对于准确分配编码具有丰富的上下文意义。本文通过引入章节类型分类与章节类型嵌入(section type embeddings),有效利用了临床文本的语篇结构。同时,针对类别不平衡问题以及临床病历与ICD编码定义之间写作风格异质性的挑战,本文提出了一种融合嵌入(reconciled embedding)方法,能够同时应对上述问题。在MIMIC数据集上的实验结果表明,所提模型显著优于以往所有最先进的方法。相关源代码已开源,地址为:https://github.com/discnet2022/discnet

基准测试

基准方法指标
medical-code-prediction-on-mimic-iiiDiscnet+RE
Macro-AUC: 95.6
Macro-F1: 14.0
Micro-AUC: 99.3
Micro-F1: 58.8
Precision@15: 61.4
Precision@8: 76.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
利用话语结构与一致化编码嵌入的自动ICD编码 | 论文 | HyperAI超神经