4 个月前

PredRNN++:解决时空预测学习中的时间深度困境

PredRNN++:解决时空预测学习中的时间深度困境

摘要

我们介绍了PredRNN++,这是一种改进的递归网络,用于视频预测学习。为了提高时空建模能力,我们的方法通过利用一种名为因果LSTM(Causal LSTM)的新递归单元,增加了相邻状态之间的转换深度,该单元以级联机制重新组织空间和时间记忆。然而,在视频预测学习中仍存在一个困境:虽然设计了越来越多的时间深度模型来捕捉复杂的动态变化,但这些模型也引入了梯度反向传播的更多困难。为了解决这一不利影响,我们提出了一种梯度高速公路(Gradient Highway)架构,该架构为从输出到远距离输入的梯度流提供了替代的较短路径。这种架构与因果LSTM无缝结合,使PredRNN++能够自适应地捕获短期和长期依赖关系。我们在合成和真实视频数据集上评估了我们的模型,展示了其缓解梯度消失问题的能力,并在物体遮挡等复杂场景下取得了最先进的预测结果。

基准测试

基准方法指标
video-prediction-on-kthPredRNN++
Cond: 10
PSNR: 28.47
Pred: 20
SSIM: 0.865
video-prediction-on-moving-mnistCausal LSTM
MAE: 106.8
MSE: 46.5
SSIM: 0.898
video-prediction-on-synpickvpPredRNN++
LPIPS: 0.053
MSE: 51.73
PSNR: 27.50
SSIM: 0.894

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PredRNN++:解决时空预测学习中的时间深度困境 | 论文 | HyperAI超神经