4 个月前

耦合振荡递归神经网络(coRNN):一种准确且(梯度)稳定的架构,用于学习长时间依赖性

耦合振荡递归神经网络(coRNN):一种准确且(梯度)稳定的架构,用于学习长时间依赖性

摘要

生物神经元电路,如大脑的功能区域,可以建模为耦合振子网络。受这些系统在保持状态变量(及其梯度)有界的同时能够产生丰富输出的启发,我们提出了一种新的递归神经网络架构。所提出的递归神经网络基于二阶常微分方程系统的时域离散化,该系统用于建模受控非线性振子网络。我们证明了隐藏状态梯度的精确界限,从而缓解了这种递归神经网络中的梯度爆炸和梯度消失问题。实验结果表明,所提出的递归神经网络在多种基准测试中表现与现有最先进方法相当,展示了该架构在处理复杂序列数据时提供稳定且准确的递归神经网络的潜力。

代码仓库

tk-rusch/coRNN
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
sentiment-analysis-on-imdbcoRNN
Accuracy: 87.4%
sequential-image-classification-on-noisecoRNN
% Test Accuracy: 59.0
sequential-image-classification-on-sequentialcoRNN
Permuted Accuracy: 97.34%
Unpermuted Accuracy: 99.4%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
耦合振荡递归神经网络(coRNN):一种准确且(梯度)稳定的架构,用于学习长时间依赖性 | 论文 | HyperAI超神经