3 个月前

用于视频帧插值的统一金字塔循环网络

用于视频帧插值的统一金字塔循环网络

摘要

光流引导的合成为帧插值提供了一个统一的框架,其中通过估计光流来指导连续输入帧之间中间帧的生成。本文提出一种新型的统一金字塔递归网络——UPR-Net,用于帧插值任务。UPR-Net采用灵活的金字塔架构,利用轻量级的递归模块实现双向光流估计与中间帧合成。在每一金字塔层级上,网络利用估计的双向光流生成前向变形表示,以支持帧合成;而在不同金字塔层级之间,则实现了对光流与中间帧的迭代优化。特别地,我们证明了所提出的迭代合成策略能显著提升帧插值在大运动场景下的鲁棒性。尽管模型极为轻量化(仅170万参数),UPR-Net的基础版本在多个基准测试中均表现出卓越的性能。UPR-Net系列的代码及训练好的模型已开源,地址为:https://github.com/srcn-ivl/UPR-Net。

代码仓库

srcn-ivl/upr-net
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
video-frame-interpolation-on-msu-video-frameUPR-Net LARGE
LPIPS: 0.025
MS-SSIM: 0.962
PSNR: 29.73
SSIM: 0.951
VMAF: 71.34
video-frame-interpolation-on-snu-film-easyUPR-Net LARGE
PSNR: 40.44
SSIM: 0.9911
video-frame-interpolation-on-snu-film-extremeUPR-Net LARGE
PSNR: 25.63
SSIM: 0.8641
video-frame-interpolation-on-snu-film-hardUPR-Net LARGE
PSNR: 30.86
SSIM: 0.9377
video-frame-interpolation-on-snu-film-mediumUPR-Net LARGE
PSNR: 36.29
SSIM: 0.9801
video-frame-interpolation-on-ucf101-1UPR-Net LARGE
PSNR: 35.47
SSIM: 0.9700
video-frame-interpolation-on-vimeo90kUPR-Net LARGE
PSNR: 36.42
SSIM: 0.9815
video-frame-interpolation-on-x4k1000fpsUPR-Net large
PSNR: 30.68
SSIM: 0.9086

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于视频帧插值的统一金字塔循环网络 | 论文 | HyperAI超神经