4 个月前

时间调制网络用于可控时空视频超分辨率

时间调制网络用于可控时空视频超分辨率

摘要

时空视频超分辨率(STVSR)旨在提高低分辨率和低帧率视频的空间和时间分辨率。近年来,基于可变形卷积的方法在STVSR方面取得了令人鼓舞的性能,但这些方法只能推断训练阶段预定义的中间帧。此外,这些方法低估了相邻帧之间的短期运动线索。本文中,我们提出了一种时间调制网络(TMNet),以实现任意中间帧的精确高分辨率重建。具体而言,我们设计了一种时间调制块(TMB),用于调节可变形卷积核以实现可控特征插值。为了充分利用时间信息,我们提出了局部时间特征比较(LFC)模块,并结合双向可变形ConvLSTM,从视频中提取短期和长期运动线索。在三个基准数据集上的实验表明,我们的TMNet优于以往的STVSR方法。代码可在https://github.com/CS-GangXu/TMNet 获取。

代码仓库

CS-GangXu/TMNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
video-super-resolution-on-msu-super-1TMNet + x264
BSQ-rate over ERQA: 1.879
BSQ-rate over LPIPS: 1.377
BSQ-rate over MS-SSIM: 0.844
BSQ-rate over PSNR: 1.481
BSQ-rate over VMAF: 1.061
video-super-resolution-on-msu-super-1TMNet + uavs3e
BSQ-rate over ERQA: 13.187
BSQ-rate over LPIPS: 5.015
BSQ-rate over MS-SSIM: 4.317
BSQ-rate over PSNR: 15.144
BSQ-rate over VMAF: 3.487
video-super-resolution-on-msu-super-1TMNet + vvenc
BSQ-rate over ERQA: 21.303
BSQ-rate over LPIPS: 13.988
BSQ-rate over MS-SSIM: 1.813
BSQ-rate over PSNR: 9.43
BSQ-rate over VMAF: 1.795
video-super-resolution-on-msu-super-1TMNet + x265
BSQ-rate over ERQA: 13.577
BSQ-rate over LPIPS: 13.485
BSQ-rate over MS-SSIM: 1.735
BSQ-rate over PSNR: 7.046
BSQ-rate over VMAF: 2.009
video-super-resolution-on-msu-super-1TMNet + aomenc
BSQ-rate over ERQA: 21.798
BSQ-rate over LPIPS: 6.276
BSQ-rate over MS-SSIM: 10.322
BSQ-rate over PSNR: 15.144
BSQ-rate over VMAF: 4.667
video-super-resolution-on-msu-vsr-benchmarkTMNet
1 - LPIPS: 0.931
ERQAv1.0: 0.712
FPS: 1.136
PSNR: 30.364
QRCRv1.0: 0.549
SSIM: 0.885
Subjective score: 6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
时间调制网络用于可控时空视频超分辨率 | 论文 | HyperAI超神经