
摘要
在实际应用中,如医疗保健、地球科学和生物学等领域,多变量时间序列数据通常具有多种缺失值。在时间序列预测及其他相关任务中,已观察到缺失值及其缺失模式往往与目标标签相关,即所谓的信息性缺失(informative missingness)。然而,利用这些缺失模式进行有效插补并提高预测性能的研究工作非常有限。本文中,我们开发了一种新颖的深度学习模型——GRU-D,这是早期尝试之一。GRU-D 基于门控循环单元(Gated Recurrent Unit, GRU),这是一种最先进的循环神经网络。该模型采用了两种表示缺失模式的方法,即掩码(masking)和时间间隔(time interval),并将它们有效地融入深度模型架构中,不仅捕捉了时间序列中的长期时序依赖关系,还利用了缺失模式以实现更好的预测结果。在真实世界临床数据集(MIMIC-III、PhysioNet)和合成数据集上的时间序列分类任务实验表明,我们的模型达到了最先进水平,并为更好地理解和利用时间序列分析中的缺失值提供了有价值的见解。
代码仓库
fteufel/PyTorch-GRU-D
pytorch
GitHub 中提及
Han-JD/GRU-D
pytorch
GitHub 中提及
sindhura97/STraTS
pytorch
GitHub 中提及
edwinlebreton/Birds
tf
GitHub 中提及
Paul-Jacquit/Birds
tf
GitHub 中提及
WenjieDu/PyPOTS
官方
pytorch
PeterChe1990/GRU-D
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multivariate-time-series-forecasting-on-1 | RNN GRU-D | MSE (10^-2, 50% missing): 5.833 |
| multivariate-time-series-imputation-on-mujoco | RNN GRU-D | MSE (10^2, 50% missing): 0.748 |
| time-series-classification-on-physionet | GRU-D | AUC: 84.24% AUC Stdev: 0.012% |