HyperAIHyperAI

Command Palette

Search for a command to run...

PatchMixer:一种用于长期时间序列预测的分块混合架构

Zeying Gong Yujin Tang Junwei Liang

摘要

尽管近年来Transformer已成为时间序列预测任务中的主流架构,但一个根本性挑战依然存在:Transformer中的置换不变性自注意力机制会导致时间信息的丢失。为应对这一挑战,我们提出了一种新型基于CNN的模型——PatchMixer。该模型引入了一种置换相关(permutation-variant)的卷积结构,以有效保留时间序列中的时序信息。与该领域中通常采用多尺度或大量分支结构的常规CNN不同,我们的方法仅依赖深度可分离卷积(depthwise separable convolutions),从而在单一尺度架构下即可同时捕捉局部特征与全局相关性。此外,我们设计了双预测头结构,包含线性和非线性两部分,以更精准地建模未来序列的趋势与细节。在七个时间序列预测基准上的实验结果表明,相较于当前最先进的方法以及表现最佳的CNN模型,PatchMixer分别实现了3.9%和21.2%的相对性能提升,同时推理速度比最先进的方法快2至3倍。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供