3 个月前

基于流的视频帧合成中的邻域对应匹配

基于流的视频帧合成中的邻域对应匹配

摘要

视频帧合成(video frame synthesis)包括插值与外推两种操作,是一种重要的视频处理技术,可广泛应用于多种场景。然而,现有大多数方法在处理小目标或大运动时表现不佳,尤其在高分辨率视频(如4K视频)中更为明显。为克服上述局限性,本文提出一种基于邻域对应匹配(Neighbor Correspondence Matching, NCM)的光流驱动帧合成算法。由于在帧合成过程中当前帧不可用,NCM采用与当前帧无关(current-frame-agnostic)的策略,在每个像素的时空邻域内建立多尺度对应关系。基于NCM强大的运动建模能力,我们进一步提出一种异构的粗到细(coarse-to-fine)框架,用于估计中间光流以实现帧合成。具体而言,粗粒度模块利用邻域对应关系捕捉大范围运动,而细粒度模块则具有更高的计算效率,从而加速估计过程。两个模块采用渐进式训练策略,有效弥合了训练数据集与真实视频之间的分辨率差异。实验结果表明,NCM在多个基准测试上均达到了当前最优性能。此外,NCM可广泛应用于视频压缩等多种实际场景,并显著提升性能。

基准测试

基准方法指标
video-frame-interpolation-on-ucf101-1NCM-Base
PSNR: 35.36
SSIM: 0.9695
video-frame-interpolation-on-vimeo90kNCM-Base
PSNR: 35.88
SSIM: 0.9795
video-frame-interpolation-on-x4k1000fpsNCM-Base
PSNR: 31.63
SSIM: 0.9185

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于流的视频帧合成中的邻域对应匹配 | 论文 | HyperAI超神经