
摘要
光流引导的合成为帧插值提供了一个统一的框架,其中通过估计光流来指导连续输入帧之间中间帧的生成。本文提出一种新型的统一金字塔递归网络——UPR-Net,用于帧插值任务。UPR-Net采用灵活的金字塔架构,利用轻量级的递归模块实现双向光流估计与中间帧合成。在每一金字塔层级上,网络利用估计的双向光流生成前向变形表示,以支持帧合成;而在不同金字塔层级之间,则实现了对光流与中间帧的迭代优化。特别地,我们证明了所提出的迭代合成策略能显著提升帧插值在大运动场景下的鲁棒性。尽管模型极为轻量化(仅170万参数),UPR-Net的基础版本在多个基准测试中均表现出卓越的性能。UPR-Net系列的代码及训练好的模型已开源,地址为:https://github.com/srcn-ivl/UPR-Net。
代码仓库
srcn-ivl/upr-net
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-frame-interpolation-on-msu-video-frame | UPR-Net LARGE | LPIPS: 0.025 MS-SSIM: 0.962 PSNR: 29.73 SSIM: 0.951 VMAF: 71.34 |
| video-frame-interpolation-on-snu-film-easy | UPR-Net LARGE | PSNR: 40.44 SSIM: 0.9911 |
| video-frame-interpolation-on-snu-film-extreme | UPR-Net LARGE | PSNR: 25.63 SSIM: 0.8641 |
| video-frame-interpolation-on-snu-film-hard | UPR-Net LARGE | PSNR: 30.86 SSIM: 0.9377 |
| video-frame-interpolation-on-snu-film-medium | UPR-Net LARGE | PSNR: 36.29 SSIM: 0.9801 |
| video-frame-interpolation-on-ucf101-1 | UPR-Net LARGE | PSNR: 35.47 SSIM: 0.9700 |
| video-frame-interpolation-on-vimeo90k | UPR-Net LARGE | PSNR: 36.42 SSIM: 0.9815 |
| video-frame-interpolation-on-x4k1000fps | UPR-Net large | PSNR: 30.68 SSIM: 0.9086 |