3 个月前

深度盲视频超分辨率

深度盲视频超分辨率

摘要

现有的视频超分辨率(Video Super-Resolution, SR)算法通常假设退化过程中的模糊核(blur kernel)是已知的,并且在重建过程中不显式建模模糊核。然而,这一假设在实际视频超分辨率任务中并不成立,往往导致重建图像过度平滑,细节丢失严重。为此,本文提出一种基于模糊核建模的深度卷积神经网络(CNN)模型,用于解决视频超分辨率问题。所提出的深度CNN模型由三个核心模块构成:运动模糊估计模块、运动估计模块和潜在图像重建模块。其中,运动模糊估计模块用于可靠地估计模糊核;结合所估计的模糊核,我们基于视频超分辨率的图像形成模型,设计了一种图像反卷积方法,以生成中间潜在图像,从而有效恢复部分清晰的图像细节。然而,生成的中间潜在图像可能引入伪影。为获得高质量的最终输出,我们引入运动估计模块,利用相邻帧之间的时序信息,通过运动约束增强深度CNN模型的重建能力,进一步提升图像质量。实验结果表明,所提出的算法能够生成更加清晰、结构细节更丰富的图像。大量对比实验验证了该方法在性能上优于当前最先进的视频超分辨率技术。

代码仓库

cscss/DBVSR
pytorch
GitHub 中提及

基准测试

基准方法指标
video-super-resolution-on-msu-super-1DBVSR + x265
BSQ-rate over ERQA: 13.145
BSQ-rate over LPIPS: 13.211
BSQ-rate over MS-SSIM: 1.438
BSQ-rate over PSNR: 6.607
BSQ-rate over VMAF: 1.383
video-super-resolution-on-msu-super-1DBVSR + vvenc
BSQ-rate over ERQA: 15.988
BSQ-rate over LPIPS: 11.435
BSQ-rate over MS-SSIM: 0.898
BSQ-rate over PSNR: 5.765
BSQ-rate over Subjective Score: 2.842
BSQ-rate over VMAF: 0.698
video-super-resolution-on-msu-super-1DBVSR + x264
BSQ-rate over ERQA: 1.606
BSQ-rate over LPIPS: 1.293
BSQ-rate over MS-SSIM: 0.714
BSQ-rate over PSNR: 1.082
BSQ-rate over VMAF: 0.75
video-super-resolution-on-msu-super-1DBVSR + aomenc
BSQ-rate over ERQA: 13.476
BSQ-rate over LPIPS: 4.916
BSQ-rate over MS-SSIM: 3.886
BSQ-rate over PSNR: 10.296
BSQ-rate over VMAF: 2.093
video-super-resolution-on-msu-super-1DBVSR + uavs3e
BSQ-rate over ERQA: 7.0
BSQ-rate over LPIPS: 4.371
BSQ-rate over MS-SSIM: 2.396
BSQ-rate over PSNR: 5.845
BSQ-rate over VMAF: 1.83
video-super-resolution-on-msu-video-upscalersDBVSR
PSNR: 27.28
SSIM: 0.937
VMAF: 57.39
video-super-resolution-on-msu-vsr-benchmarkDBVSR
1 - LPIPS: 0.921
ERQAv1.0: 0.737
FPS: 0.241
PSNR: 31.071
QRCRv1.0: 0.629
SSIM: 0.894
Subjective score: 6.947

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度盲视频超分辨率 | 论文 | HyperAI超神经