
摘要
从临床文本中预测结果可以防止医生忽视潜在风险,并帮助医院规划容量。我们在患者入院时进行模拟,此时决策支持尤为重要,并提出了一项新的从入院到出院的任务,包括四个常见的结果预测目标:出院诊断、所进行的手术、院内死亡率和住院时间预测。理想的系统应根据患者的症状、既往病史和风险因素来推断结果。我们评估了语言模型在处理这一场景中的有效性,并提出了临床结果预训练方法,以整合来自多个公共来源的患者结果知识。此外,我们还介绍了一种简单的方法,将国际疾病分类(ICD)代码层次结构纳入模型中。研究表明,我们的方法在结果预测任务上优于多个基线模型。详细分析进一步揭示了该模型的优势,如可迁移性,但也指出了其弱点,例如对生命体征值的处理和底层数据中的不一致性问题。
代码仓库
bvanaken/clinical-outcome-prediction
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| length-of-stay-prediction-on-clinical | CORe | AUROC: 72.53 |
| length-of-stay-prediction-on-clinical | BERT Base | AUROC: 70.40 |
| length-of-stay-prediction-on-clinical | BioBERT Base | AUROC: 71.59 |
| medical-diagnosis-on-clinical-admission-notes | CORe | AUROC: 83.54 |
| medical-diagnosis-on-clinical-admission-notes | BioBERT Base | AUROC: 82.81 |
| medical-procedure-on-clinical-admission-notes | CORe | AUROC: 88.37 |
| medical-procedure-on-clinical-admission-notes | BERT Base | AUROC: 85.84 |
| medical-procedure-on-clinical-admission-notes | BioBERT Base | AUROC: 86.36 |
| mortality-prediction-on-clinical-admission | CORe | AUROC: 84.04 |
| mortality-prediction-on-clinical-admission | BERT Base | AUROC: 81.13 |
| mortality-prediction-on-clinical-admission | BioBERT Base | AUROC: 82.55 |