
摘要
准确性和可解释性是成功预测模型的两个主要特征。通常情况下,为了提高准确性,需要选择复杂的黑箱模型(如循环神经网络(RNN)),而为了提高可解释性,则需要选择虽然准确性较低但更容易解释的传统模型(如逻辑回归)。这种权衡在医学领域尤为棘手,因为医学既需要高准确性又需要良好的可解释性。为了解决这一挑战,我们开发了逆向时间注意力模型(REverse Time AttentIoN model,简称RETAIN),并将其应用于电子健康记录(EHR)数据。RETAIN 在保持高准确性的同时仍然具有临床可解释性,其基于一个双层神经注意力模型,该模型能够检测出有影响力的过往就诊记录以及这些记录中的重要临床变量(例如关键诊断)。RETAIN 模拟医生的诊疗实践,通过逆向时间顺序关注EHR数据,使得最近的临床就诊记录更有可能获得更高的关注度。RETAIN 在一个包含26.3万名患者8年间完成的1400万次就诊的大规模健康系统EHR数据集上进行了测试,结果表明其预测准确性和计算可扩展性与最先进的方法(如RNN)相当,并且其可解释性与传统模型相当。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| disease-trajectory-forecasting-on-uk-cf-trust | RETAIN | AUC (ABPA): 0.685 AUC (Aspergillus): 0.641 AUC (Diabetes): 0.764 AUC (E. Coli): 0.697 AUC (I. Obstruction): 0.578 AUC (K. Pneumonia): 0.715 I. Obstruction: 0.578 |