3 个月前

基于深度学习的4K视频实时超分辨率系统

基于深度学习的4K视频实时超分辨率系统

摘要

视频超分辨率(Video Super-Resolution, VSR)技术在重建低质量视频方面表现出色,能够有效避免基于插值算法带来的不自然模糊问题。然而,其庞大的计算复杂度与内存占用严重制约了该技术在边缘设备上的部署可行性,也限制了其在实际应用中的实时推理能力,尤其是在大规模VSR任务中更为显著。本文探索了实现实时VSR系统的可能性,并设计了一种高效且通用的VSR网络架构,命名为EGVSR。所提出的EGVSR基于时空对抗学习机制,以保障时序一致性。为实现高达4K分辨率的快速处理能力,本文采用轻量级网络结构与高效的上采样方法,在保证高视觉质量的前提下显著降低了EGVSR网络的计算开销。此外,我们在实际硬件平台上实现了批量归一化计算融合、卷积加速算法等神经网络加速技术,进一步优化了EGVSR网络的推理性能。最终,EGVSR实现了4K分辨率下29.61帧/秒的实时处理能力。相较于当前最先进的VSR网络TecoGAN,本方法在计算密度上降低了85.04%,性能提升达7.92倍。在视觉质量方面,EGVSR在公开测试数据集Vid4上的多项指标(如LPIPS、tOF、tLP等)中均取得最优表现,并在整体性能评分上超越了其他先进方法。本项目源代码已开源,可访问 https://github.com/Thmen/EGVSR 获取。

代码仓库

Thmen/EGVSR
官方
pytorch

基准测试

基准方法指标
video-super-resolution-on-msu-super-1EGVSR + x265
BSQ-rate over ERQA: 12.917
BSQ-rate over LPIPS: 10.748
BSQ-rate over MS-SSIM: 5.548
BSQ-rate over PSNR: 10.701
BSQ-rate over VMAF: 6.497
video-super-resolution-on-msu-super-1EGVSR + uavs3e
BSQ-rate over ERQA: 10.1
BSQ-rate over LPIPS: 4.0
BSQ-rate over MS-SSIM: 8.194
BSQ-rate over PSNR: 15.144
BSQ-rate over VMAF: 10.337
video-super-resolution-on-msu-super-1EGVSR + x264
BSQ-rate over ERQA: 6.029
BSQ-rate over LPIPS: 1.226
BSQ-rate over MS-SSIM: 1.196
BSQ-rate over PSNR: 10.595
BSQ-rate over VMAF: 1.519
video-super-resolution-on-msu-super-1EGVSR + aomenc
BSQ-rate over ERQA: 16.733
BSQ-rate over LPIPS: 5.67
BSQ-rate over MS-SSIM: 11.643
BSQ-rate over PSNR: 15.144
BSQ-rate over VMAF: 10.67
video-super-resolution-on-msu-super-1EGVSR + vvenc
BSQ-rate over ERQA: 13.684
BSQ-rate over LPIPS: 10.643
BSQ-rate over MS-SSIM: 6.209
BSQ-rate over PSNR: 11.543
BSQ-rate over VMAF: 10.163
video-super-resolution-on-msu-video-upscalersEGVSR
PSNR: 26.33
SSIM: 0.929
VMAF: 60.39

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于深度学习的4K视频实时超分辨率系统 | 论文 | HyperAI超神经