4 个月前

使用时间核化自动编码器学习缺失数据的多变量时间序列表示

使用时间核化自动编码器学习缺失数据的多变量时间序列表示

摘要

学习多变量时间序列(MTS)的压缩表示有助于在存在噪声和冗余信息的情况下进行数据分析,尤其是在变量数量和时间步长较多时。然而,经典的降维方法是为向量数据设计的,无法显式处理缺失值。在这项工作中,我们提出了一种基于循环神经网络的新颖自编码器架构,用于生成MTS的压缩表示。所提出的模型可以处理具有不同长度的输入,并且专门设计用于处理缺失数据。我们的自编码器学习固定长度的向量表示,这些表示之间的成对相似性与在输入空间中操作并处理缺失值的核函数对齐。这使得即使在存在大量缺失数据的情况下也能学习到良好的表示。为了展示所提方法的有效性,我们在多个分类任务中评估了所学表示的质量,包括涉及医疗数据的任务,并将其与其他降维方法进行了比较。随后,我们基于所提出的架构设计了两个框架:一个用于填补缺失数据,另一个用于单类分类。最后,我们分析了在什么情况下带有循环层的自编码器可以比前馈架构更好地学习MTS的压缩表示。

基准测试

基准方法指标
time-series-classification-on-physionet-2017TKAE
AUC: 0.732

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用时间核化自动编码器学习缺失数据的多变量时间序列表示 | 论文 | HyperAI超神经