3 个月前

基于密集查询双边相关性的视频帧插值

基于密集查询双边相关性的视频帧插值

摘要

视频帧插值(Video Frame Interpolation, VFI)旨在生成存在于实际帧之间的中间帧。基于光流的VFI算法通过估计中间运动场,对现有帧进行几何变换以生成中间帧。然而,现实世界中运动的复杂性以及参考帧的缺失,使得运动估计面临巨大挑战。许多最先进的方法通过显式建模相邻两帧之间的相关性,以提升运动估计的准确性。在常规方法中,高分辨率下相关性建模的感受野依赖于先前估计的运动场。这种感受野依赖性导致传统运动估计方法在处理小尺寸或高速运动物体时表现不佳。为更有效地建模帧间相关性并生成更精确的运动场,本文提出一种无感受野依赖的密集查询双边相关性(Densely Queried Bilateral Correlation, DQBC)机制,从而显著提升对小尺寸及快速运动物体的建模能力。在DQBC生成的运动场基础上,进一步结合上下文特征进行精细化修正与上采样。当运动场确定后,基于CNN的SynthNet网络负责合成最终的插值帧。实验结果表明,所提方法在精度和推理速度方面均优于当前最先进的技术。代码已开源,地址为:https://github.com/kinoud/DQBC。

代码仓库

kinoud/DQBC
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
video-frame-interpolation-on-msu-video-frameDQBC
LPIPS: 0.021
MS-SSIM: 0.961
PSNR: 29.45
SSIM: 0.949
VMAF: 72.12
video-frame-interpolation-on-snu-film-easyDQBC
PSNR: 40.31
SSIM: 0.9909
video-frame-interpolation-on-snu-film-extremeDQBC
PSNR: 25.61
SSIM: 0.8648
video-frame-interpolation-on-snu-film-hardDQBC
PSNR: 30.94
SSIM: 0.9378
video-frame-interpolation-on-snu-film-mediumDQBC
PSNR: 36.25
SSIM: 0.9799
video-frame-interpolation-on-ucf101-1DQBC
PSNR: 35.44
SSIM: 0.9700
video-frame-interpolation-on-vimeo90kDQBC
PSNR: 36.57
SSIM: 0.9817

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于密集查询双边相关性的视频帧插值 | 论文 | HyperAI超神经