4 个月前

通用卷积和循环网络在序列建模中的实证评估

通用卷积和循环网络在序列建模中的实证评估

摘要

对于大多数深度学习从业者而言,序列建模几乎等同于循环网络。然而,最近的研究结果表明,在诸如音频合成和机器翻译等任务中,卷积架构可以超越循环网络的表现。面对一个新的序列建模任务或数据集时,应该选择哪种架构?我们对用于序列建模的通用卷积架构和循环架构进行了系统评估。这些模型在一系列常用于评估循环网络的标准任务上进行了测试。我们的研究结果表明,一个简单的卷积架构在多种任务和数据集上优于经典的循环网络(如LSTM),并且表现出更长的有效记忆能力。因此,我们认为应当重新考虑序列建模与循环网络之间的普遍联系,并将卷积网络视为序列建模任务的一个自然起点。为了帮助相关研究工作,我们已将代码发布在 http://github.com/locuslab/TCN 。

代码仓库

philipperemy/keras-tcn
tf
GitHub 中提及
Songweiping/TCN-TF
tf
GitHub 中提及
proroklab/popgym
pytorch
GitHub 中提及
ratschlab/HIRID-ICU-Benchmark
pytorch
GitHub 中提及
rvandewater/yaib
pytorch
GitHub 中提及
ZTianle/keras-tcn-solar
tf
GitHub 中提及
zll1996/TCN
tf
GitHub 中提及
zhong110020/keras-tcn
tf
GitHub 中提及
linxi159/TCN
pytorch
GitHub 中提及
locuslab/TCN
官方
pytorch
GitHub 中提及
YuanTingHsieh/TF_TCN
tf
GitHub 中提及
hkchengrex/TCN
pytorch
GitHub 中提及
MChen9/TCN
tf
GitHub 中提及
zhong110020/Tensorflow-TCN
tf
GitHub 中提及
ShotDownDiane/tcn-master
tf
GitHub 中提及
zhong110020/TensorFlow_TCN
tf
GitHub 中提及
Baichenjia/Tensorflow-TCN
tf
GitHub 中提及
zhong110020/pytorch_TCN
pytorch
GitHub 中提及
mhjabreel/CharCnn_Keras
tf
GitHub 中提及
jakeret/tcn
tf
GitHub 中提及
sindhura97/STraTS
pytorch
GitHub 中提及
ashishpatel26/tcn-keras-Examples
pytorch
GitHub 中提及
WenjieDu/PyPOTS
pytorch
GitHub 中提及
patHutchings/TCN
pytorch
GitHub 中提及
Nic5472K/FriendsOOGroup_TCN
pytorch
GitHub 中提及
kingcong/TCN
mindspore
GitHub 中提及
selmiss/gp-tlstgcn
pytorch
GitHub 中提及
anandharaju/Basic_TCN
tf
GitHub 中提及

基准测试

基准方法指标
language-modelling-on-penn-treebank-characterTemporal Convolutional Network
Bit per Character (BPC): 1.31
language-modelling-on-penn-treebank-wordLSTM (Bai et al., 2018)
Test perplexity: 78.93
language-modelling-on-penn-treebank-wordGRU (Bai et al., 2018)
Test perplexity: 92.48
language-modelling-on-wikitext-103TCN
Test perplexity: 45.19
music-modeling-on-jsb-choralesTCN
NLL: 8.10
music-modeling-on-nottinghamGRU
NLL: 3.46
music-modeling-on-nottinghamLSTM
NLL: 3.29
music-modeling-on-nottinghamTCN
NLL: 3.07
music-modeling-on-nottinghamRNN
NLL: 4.05
sequential-image-classification-on-sequentialTemporal Convolutional Network
Permuted Accuracy: 97.2%
Unpermuted Accuracy: 99.0%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通用卷积和循环网络在序列建模中的实证评估 | 论文 | HyperAI超神经