
摘要
时空视频超分辨率(STVSR)旨在提高低分辨率和低帧率视频的空间和时间分辨率。近年来,基于可变形卷积的方法在STVSR方面取得了令人鼓舞的性能,但这些方法只能推断训练阶段预定义的中间帧。此外,这些方法低估了相邻帧之间的短期运动线索。本文中,我们提出了一种时间调制网络(TMNet),以实现任意中间帧的精确高分辨率重建。具体而言,我们设计了一种时间调制块(TMB),用于调节可变形卷积核以实现可控特征插值。为了充分利用时间信息,我们提出了局部时间特征比较(LFC)模块,并结合双向可变形ConvLSTM,从视频中提取短期和长期运动线索。在三个基准数据集上的实验表明,我们的TMNet优于以往的STVSR方法。代码可在https://github.com/CS-GangXu/TMNet 获取。
代码仓库
CS-GangXu/TMNet
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-super-resolution-on-msu-super-1 | TMNet + x264 | BSQ-rate over ERQA: 1.879 BSQ-rate over LPIPS: 1.377 BSQ-rate over MS-SSIM: 0.844 BSQ-rate over PSNR: 1.481 BSQ-rate over VMAF: 1.061 |
| video-super-resolution-on-msu-super-1 | TMNet + uavs3e | BSQ-rate over ERQA: 13.187 BSQ-rate over LPIPS: 5.015 BSQ-rate over MS-SSIM: 4.317 BSQ-rate over PSNR: 15.144 BSQ-rate over VMAF: 3.487 |
| video-super-resolution-on-msu-super-1 | TMNet + vvenc | BSQ-rate over ERQA: 21.303 BSQ-rate over LPIPS: 13.988 BSQ-rate over MS-SSIM: 1.813 BSQ-rate over PSNR: 9.43 BSQ-rate over VMAF: 1.795 |
| video-super-resolution-on-msu-super-1 | TMNet + x265 | BSQ-rate over ERQA: 13.577 BSQ-rate over LPIPS: 13.485 BSQ-rate over MS-SSIM: 1.735 BSQ-rate over PSNR: 7.046 BSQ-rate over VMAF: 2.009 |
| video-super-resolution-on-msu-super-1 | TMNet + aomenc | BSQ-rate over ERQA: 21.798 BSQ-rate over LPIPS: 6.276 BSQ-rate over MS-SSIM: 10.322 BSQ-rate over PSNR: 15.144 BSQ-rate over VMAF: 4.667 |
| video-super-resolution-on-msu-vsr-benchmark | TMNet | 1 - LPIPS: 0.931 ERQAv1.0: 0.712 FPS: 1.136 PSNR: 30.364 QRCRv1.0: 0.549 SSIM: 0.885 Subjective score: 6 |