4 个月前

长表达记忆用于序列建模

长表达记忆用于序列建模

摘要

我们提出了一种称为长表达记忆(Long Expressive Memory, LEM)的新方法,用于学习长期序列依赖关系。LEM 是基于梯度的方法,能够高效处理具有非常长期依赖关系的序列任务,并且具有足够的表达能力,可以学习复杂的输入输出映射。为了推导 LEM,我们考虑了一个多尺度常微分方程系统及其适当的时间离散化。对于 LEM,我们推导了严格的边界条件,以展示其缓解梯度爆炸和梯度消失问题的能力,这是基于梯度的递归序列学习方法所面临的一个众所周知的挑战。此外,我们还证明了 LEM 能够高精度地逼近一大类动态系统。我们的实证结果涵盖了从图像分类和时间序列分类到动态系统预测、语音识别和语言建模等多个领域,表明 LEM 在性能上优于当前最先进的递归神经网络、门控循环单元和长短时记忆模型。

代码仓库

tk-rusch/lem
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
sequential-image-classification-on-noiseLEM
% Test Accuracy: 60.5
sequential-image-classification-on-sequentialLEM
Permuted Accuracy: 96.6%
Unpermuted Accuracy: 99.5%
time-series-classification-on-eigenwormsLEM
% Test Accuracy: 92.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
长表达记忆用于序列建模 | 论文 | HyperAI超神经