3 个月前

视频超分辨率中的时序建模再思考

视频超分辨率中的时序建模再思考

摘要

视频超分辨率在监控视频分析和超高清视频显示中发挥着重要作用,近年来在学术界与工业界均受到广泛关注。尽管已有大量基于深度学习的视频超分辨率(VSR)方法被提出,但由于不同损失函数和训练数据集对超分辨率结果具有显著影响,使得这些方法之间的直接比较变得困难。本文系统地研究并对比了三种时序建模方法:基于早期融合的2D卷积神经网络(2D CNN)、基于慢速融合的3D卷积神经网络(3D CNN)以及循环神经网络(Recurrent Neural Network, RNN)。同时,本文提出一种新型的循环残差网络(Recurrent Residual Network, RRN),用于实现高效视频超分辨率。该方法利用残差学习机制,不仅有效稳定了RNN的训练过程,还显著提升了超分辨率性能。大量实验结果表明,所提出的RRN在保持高计算效率的同时,能够生成具有更精细细节且时序一致的超分辨率视频结果,优于其他时序建模方法。此外,该方法在多个广泛使用的基准测试中均取得了当前最优的性能表现。

代码仓库

基准测试

基准方法指标
video-super-resolution-on-msu-vsr-benchmarkRRN-5L
1 - LPIPS: 0.856
ERQAv1.0: 0.617
FPS: 2.74
PSNR: 23.786
QRCRv1.0: 0.549
SSIM: 0.789
Subjective score: 5.02
video-super-resolution-on-msu-vsr-benchmarkRRN-10L
1 - LPIPS: 0.842
ERQAv1.0: 0.627
FPS: 2.567
PSNR: 24.252
QRCRv1.0: 0.557
SSIM: 0.79
Subjective score: 5.35
video-super-resolution-on-spmcs-4x-upscalingRRN-L
PSNR: 29.84
SSIM: 0.8690
video-super-resolution-on-udm10-4x-upscalingRRN-L
PSNR: 38.97
SSIM: 0.9534
video-super-resolution-on-vid4-4x-upscaling-1RRN
PSNR: 27.69
SSIM: 0.8488

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
视频超分辨率中的时序建模再思考 | 论文 | HyperAI超神经