4 个月前

具有软地址和硬地址方案的动态神经图灵机

具有软地址和硬地址方案的动态神经图灵机

摘要

我们通过引入可训练的记忆寻址方案,将神经图灵机(NTM)模型扩展为动态神经图灵机(D-NTM)。该寻址方案为每个记忆单元维护两个独立的向量:内容向量和地址向量。这使得D-NTM能够学习多种基于位置的寻址策略,包括线性和非线性策略。我们分别实现了具有连续、可微分读写机制和离散、不可微分读写机制的D-NTM。我们通过在Facebook bAbI任务上使用前馈控制器和GRU控制器进行实验,研究了学习从记忆中读取和写入的机制及其效果。D-NTM在一系列Facebook bAbI任务上的表现优于NTM和LSTM基线模型。我们对我们的模型以及bAbI任务中的不同NTM变体进行了广泛的分析。此外,我们还提供了在顺序pMNIST、斯坦福自然语言推理、关联回忆和复制任务上的进一步实验结果。

基准测试

基准方法指标
question-answering-on-babiDMN+
Accuracy (trained on 10k): 97.2%
Accuracy (trained on 1k): 66.8%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
具有软地址和硬地址方案的动态神经图灵机 | 论文 | HyperAI超神经