HyperAIHyperAI

Command Palette

Search for a command to run...

长表达记忆用于序列建模

T. Konstantin Rusch; Siddhartha Mishra; N. Benjamin Erichson; Michael W. Mahoney

摘要

我们提出了一种称为长表达记忆(Long Expressive Memory, LEM)的新方法,用于学习长期序列依赖关系。LEM 是基于梯度的方法,能够高效处理具有非常长期依赖关系的序列任务,并且具有足够的表达能力,可以学习复杂的输入输出映射。为了推导 LEM,我们考虑了一个多尺度常微分方程系统及其适当的时间离散化。对于 LEM,我们推导了严格的边界条件,以展示其缓解梯度爆炸和梯度消失问题的能力,这是基于梯度的递归序列学习方法所面临的一个众所周知的挑战。此外,我们还证明了 LEM 能够高精度地逼近一大类动态系统。我们的实证结果涵盖了从图像分类和时间序列分类到动态系统预测、语音识别和语言建模等多个领域,表明 LEM 在性能上优于当前最先进的递归神经网络、门控循环单元和长短时记忆模型。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
长表达记忆用于序列建模 | 论文 | HyperAI超神经