
摘要
视频超分辨率(Video Super-Resolution, VSR)技术在重建低质量视频方面表现出色,能够有效避免基于插值算法带来的不自然模糊问题。然而,其庞大的计算复杂度与内存占用严重制约了该技术在边缘设备上的部署可行性,也限制了其在实际应用中的实时推理能力,尤其是在大规模VSR任务中更为显著。本文探索了实现实时VSR系统的可能性,并设计了一种高效且通用的VSR网络架构,命名为EGVSR。所提出的EGVSR基于时空对抗学习机制,以保障时序一致性。为实现高达4K分辨率的快速处理能力,本文采用轻量级网络结构与高效的上采样方法,在保证高视觉质量的前提下显著降低了EGVSR网络的计算开销。此外,我们在实际硬件平台上实现了批量归一化计算融合、卷积加速算法等神经网络加速技术,进一步优化了EGVSR网络的推理性能。最终,EGVSR实现了4K分辨率下29.61帧/秒的实时处理能力。相较于当前最先进的VSR网络TecoGAN,本方法在计算密度上降低了85.04%,性能提升达7.92倍。在视觉质量方面,EGVSR在公开测试数据集Vid4上的多项指标(如LPIPS、tOF、tLP等)中均取得最优表现,并在整体性能评分上超越了其他先进方法。本项目源代码已开源,可访问 https://github.com/Thmen/EGVSR 获取。
代码仓库
Thmen/EGVSR
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-super-resolution-on-msu-super-1 | EGVSR + x265 | BSQ-rate over ERQA: 12.917 BSQ-rate over LPIPS: 10.748 BSQ-rate over MS-SSIM: 5.548 BSQ-rate over PSNR: 10.701 BSQ-rate over VMAF: 6.497 |
| video-super-resolution-on-msu-super-1 | EGVSR + uavs3e | BSQ-rate over ERQA: 10.1 BSQ-rate over LPIPS: 4.0 BSQ-rate over MS-SSIM: 8.194 BSQ-rate over PSNR: 15.144 BSQ-rate over VMAF: 10.337 |
| video-super-resolution-on-msu-super-1 | EGVSR + x264 | BSQ-rate over ERQA: 6.029 BSQ-rate over LPIPS: 1.226 BSQ-rate over MS-SSIM: 1.196 BSQ-rate over PSNR: 10.595 BSQ-rate over VMAF: 1.519 |
| video-super-resolution-on-msu-super-1 | EGVSR + aomenc | BSQ-rate over ERQA: 16.733 BSQ-rate over LPIPS: 5.67 BSQ-rate over MS-SSIM: 11.643 BSQ-rate over PSNR: 15.144 BSQ-rate over VMAF: 10.67 |
| video-super-resolution-on-msu-super-1 | EGVSR + vvenc | BSQ-rate over ERQA: 13.684 BSQ-rate over LPIPS: 10.643 BSQ-rate over MS-SSIM: 6.209 BSQ-rate over PSNR: 11.543 BSQ-rate over VMAF: 10.163 |
| video-super-resolution-on-msu-video-upscalers | EGVSR | PSNR: 26.33 SSIM: 0.929 VMAF: 60.39 |