
摘要
摘要:我们提出了一种深度贝叶斯视频帧插值方法,这是一种全新的时域上采样技术,可将低帧率视频高效地转换为高帧率视频。该方法通过学习光流与待插值帧的后验分布,并采用学习型梯度下降进行优化,从而实现快速收敛。每一学习步骤均由一个轻量级网络构成,负责调控估计帧与光流的对数似然梯度。这些梯度通过显式或隐式参数化方式建模,以衡量当前估计结果与真实图像及光流分布的一致性,从而有效解释输入观测数据。实验表明,该方法在10个基准测试中的8个上取得了新的最优性能,且所用模型参数量仅为当前最先进模型的一半。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-frame-interpolation-on-davis | DBVI | PSNR: 28.61 SSIM: 0.905 |
| video-frame-interpolation-on-gopro | DBVI | PSNR: 31.73 SSIM: 0.947 |
| video-frame-interpolation-on-snu-film-easy | DBVI | PSNR: 40.46 SSIM: 0.991 |
| video-frame-interpolation-on-snu-film-extreme | DBVI | PSNR: 25.90 SSIM: 0.876 |
| video-frame-interpolation-on-snu-film-hard | DBVI | PSNR: 31.68 SSIM: 0.953 |
| video-frame-interpolation-on-snu-film-medium | DBVI | PSNR: 36.95 SSIM: 0.985 |
| video-frame-interpolation-on-x4k1000fps | DBVI | PSNR: 32.89 SSIM: 0.939 |